Então em particular,
e estou resumindo
o argumento de Montroll,
o que ele diz é o seguinte.
O jeito de explicar essa característica
dos dados
é que a companhia como um todo
visa manter o log dos preços
numa faixa constante.
Mas por que manter o log dos preços
numa faixa constante?
Bom, há uma possível
explicação psicológica,
que diz que tendemos a perceber coisas
numa escala multiplicativa, logarítmica.
Percebemos coisas como sendo
duas vezes mais caras
ou metade do preço.
Não percebemos coisas como sendo
dez dólares a mais, dez a menos.
É uma característica psicológica que vemos
não só em nossa percepção de bens sociais,
como o custo de algo,
mas coisas como luz,
nossa percepção de clima,
algo ser mais brilhante que outra coisa,
tendemos a percebê-las
multiplicativamente, não aditivamente.
Somos capazes de sentir a diferença
entre um clipe de papel e dois clipes,
numa forma que não vemos diferença
entre um tijolo,
e um tijolo e um clipe de papel,
Embora a quantidade aditiva seja a mesma,
a quantidade multiplicativa é bem menor.
Então a ideia é de que a estratégia
que a Sears Roebuck seguiu,
conscientemente ou não,
é certamente uma decisão benéfica
à corporação como um todo:
faz com que seja, por exemplo,
mais fácil vender produtos
ao manter a faixa de preços
não tão grande e não tão pequena.
O que acontece conforme crescemos
como um país, com o tempo,
e conforme as pessoas alternam
dentro do sistema da Sears Roebuck,
conforme elas alternam
o sistema de preço,
e vamos de, digamos,
vender vestidos desse tipo
para vestidos desse outro tipo,
ou roupas femininas que são assim,
pessoas tentam todo tipo de estratégias.
Se tentaram uma estratégia específica,
se tiveram um método bem esperto,
então você não esperaria
que a distribuição fosse tão facilmente
descrita por dois parâmetros.
Lembrando: os parâmetros
para uma distribuição log [sic]
é a média e a variância --
da distribuição log-normal.
E, de fato, se acreditarmos
na alegação original de Montroll,
"a distribuição de preços é representada
por essa distribuição log-normal",
estamos implicitamente concordando
que o sistema é maximamente desorganizado,
é maximamente desorganizado
sujeito a duas restrições:
a média e a variância.
Obviamente a média será restringida,
pois Sears quer alcançar um certo mercado.
A ideia é que a variância
também é restringida,
porque Sears está tentando manter
uma distribuição de preços
psicologicamente plausível,
algo que tenha um bom apelo
no mercado.
Mas o passo mais interessante
que creio que foi feito
não é só essa observação,
mas que a máxima entropia diz
que isso é tudo que está acontecendo,
essa é a única estrutura
que resta no sistema.
Todos os outros tipos
de padrões de tomada de decisão,
por exemplo, presume-se que,
se você olhar nos dados
e olhar os preços --
e, de fato, Montroll aponta isso,
se você olhar os preços dos violões,
tem alguns violões com preço aqui,
alguns com preço ali,
e talvez uns dois aqui no meio;
se olhar o preço dos vestidos,
talvez se pareça com algo assim.
Mas, em geral, todas essas decisões
que as pessoas fazem
somam incoerentemente entre si,
e o que resta, no final,
apesar do fato
que tem bilhões de dólares para
deixar o catálogo Sears do jeito certo,
apesar do fato que
uma das maiores empresas do país
é obsecada com esse problema
em particular,
todas as estratégias diferentes
que ela emprega,
e todas as estratégias diferentes
em cada seção que ela oferece,
somam de certa forma incoerente,
somam de certa forma tal
que toda estrutura,
todos os padrões que poderiam restar
sobre alguém ter uma ótima ideia
de como vender vestidos femininos,
ou alguém ter uma ótima ideia
de como vender violões,
todos os padrões diluem-se,
e o que resta
é um sistema termodinâmico,
um sistema com um número
bem pequeno de restrições.
E então, de tão grande complexidade,
surge grande simplicidade.
Isso é parte de todo o apelo
de métodos de máxima entropia.
É quase um paradoxo
conseguirmos descrever, por exemplo,
uma selva, da forma que John Harte faz,
restringindo somente duas coisas, certo?
A abundância média das espécies
e o consumo médio de energia
pelas espécies.
Se estivermos certos sobre
o argumento do ecossistema open source,
é admirável que um sistema
política e socialmente diverso,
um sistema envolvendo
estudantes e docentes,
bilionários no Google
e jovens de 12 anos,
e algum cara na Finlândia,
parece incrível que seja possível
descrever
o que advém dessas decisões complexas
através de um modelo tão simples.
Mas é exatamente isso que MaxEnt permite,
ao menos, testar como hipótese.
Isso me traz a uma citação
de que gosto muito,
E vou lê-la a vocês,
porque encontrei essa citação,
de fato, antes de encontrar
modelos de máxima entropia.
Ela é uma citação de um romance
de C. P. Snow.
Snow era um homem interessante em si.
Ele escreveu um livro famoso
chamado "As Duas Culturas",
sobre o conflito entre arte e ciência.
Mas ele também era romancista,
além de ser um cientista,
além de ser um intelectual público.
E em seu livro, The Light and the Dark,
ele se concentra em
um personagem em particular,
e isso é o narrador falando
sobre o que acontece com o herói
de The Light and the Dark.
"Geralmente, decisões construíam-se
sobre milhares de pequenos arranjos,
ideias, acordos,
'toma-lá-dá-cás'."
Aqui, ele está falando sobre
a tomada de decisões do governo britânico
na Segunda Guerra Mundial.
"Não há muito mais que
mudou decisivamente pela vontade humana.
Assim como um plano
para uma campanha militar
não surge totalmente pronto
de algum general-mestre,
ele surge de uma espécie
de movimentos brownianos
de coronéis, majores e capitães,
e o máximo que um general pode fazer
é racionalizá-lo posteriormente."
E acho que isso está no cerne
dos tipos de argumentos
que pode-se fazer com
métodos de máxima entropia.
Os argumentos que ele faz
são essencialmente
"você restringe um pequeno número
de quantidades,
e consegue explicar potencialmente
uma massa enorme da riqueza do sistema".
Um sistema que parecia impossível
de modelar de baixo para cima --
como sequer começar a modelar
a comunidade open source?
Quantos tipos de agentes
seriam necessários?
Quantos parâmetros internos distintos
para os agentes?
Será que algum agente seria definido
por seu nível de escolaridade?
Sua renda, seu tempo livre,
e se ele é ou não é solteiro?
Ou será que um agente no esquema
de precificação da Sears Roebuck,
ou a CEO da Sears Roebuck,
será que ela teria de ser definida
pela experiência dela nos campos?
E o tempo que ela colocou nisso,
e se ela tem ou não
treinamento como psicóloga?
Se você tentar criar, de baixo para cima,
um modelo baseado em agentes,
eu acho que não daria muito certo.
Invés disso, ao olhar
para as quantidades agregadas,
olhando, por exemplo,
a distribuição dos preços,
ou olhando a distribuição
de abundância de linguagens,
começa-se a perceber que, talvez,
muitos desses detalhes não importem.
Muitos desses detalhes diluem-se.
A dinâmica particular não é mais
algo que precisa-se saber necessariamente,
a fim de compreender o sistema
numa escala maior.
Pode ser possível descrever
a escolha de linguagens
no movimento open source
referenciando somente uma
ou duas quantidades,
e não é preciso sequer conhecê-las
para alguma linguagem em particular.
Tudo que precisa-se saber é:
é que a abundância média
seja fixa,
e o tempo médio de programação investido
seja fixo.