콘텐츠
잠시 전에 내 친구가 Zipf의 법칙에 관한 Vsauces 비디오, Pareto의 원리와 우리 주변의 신비한 모습을 보라고 제안했습니다. 여기 당신의주의를 끄는 작은 티저가 있습니다 - 모든 사람들의 80 %가 가장 인기있는 도시의 20 %에 삽니다. 모든 토지의 80 %가 가장 부유 한 집주인의 20 %에 속합니다. Zipf의 법칙과 Paretos 원칙에 의해 예측 된대로 모든 쓰레기의 80 %가 가장 오래된 거리의 20 %에 있습니다.
부족한? 글쎄, 내가 어제 발견 한 것처럼, 토끼 구멍이 거기서 멈추지 않는다. 회의론으로 가득 찬, 나는 사람들이 스팀 게임을하는 데 얼마나 많은 시간을 소비했는지를보기로 결정했다. 글쎄. 사람들의 시간 중 80 %가 가장 인기있는 게임의 20 %를 즐기는 데 쓰입니다 ... 흥미 롭니? 음,이 이야기에 더 많은 내용이 있습니다.
20 분이 넘는 시간을 보냈던 Vsauces의 노력은 멋지고 Zipf에 대한 큰 그림을 많이 설명합니다. 그러나 Zipf가 어떻게 작동하는지 널리 알 수있는 핵심 메커니즘을 우리에게 보여 주는 데는 매우 수줍음을 보입니다. 그래서 우리가 계속하기 전에 간단히 설명하고 싶습니다.
지프의 법칙 설명
20/80 원칙의 직감을 설명하는 몇 가지 개념적 방법이 있습니다. 가장 좋은 예는 내 의견으로는 달 크레이터에 관한 것입니다.
기본 실험
그래서, 당신이 원한다면, 손길이 닿지 않은 문이 있다는 것을 상상해보십시오 - 완전히 매끄러운 표면. 자, 무작위로 크기가 결정된 소행성이 달에 부딪치며 달아 올랐다고 말한다. 첫 번째 소행성이 상륙하면 분화구가 생깁니다. 이제 다른 사람은 안타를 치고 다른 곳에서는 분화구를 남겨 둡니다. 각 분화구는 전체 표면적의 일부이므로, 다음의 무작위 소행성이 기존 분화구에 가깝게 치고 결합하여 한 그룹을 형성 할 가능성이 있습니다. 새로운 소행성이 주어진 분화구에 충돌 할 확률은 분화구와 소행성의 기존 크기에 비례합니다. 이것은 다음 무작위 소행성이 더 큰 기존 그룹에 합류 할 가능성이 더 크다는 것을 의미합니다. 누적 된 프로세스의 일종으로 부자가되고 부유 한 가난한 자의 메커니즘을 만듭니다.
Zipfs 법이 왜 그런 신비한 보편성과 함께 작동하는지에 대한 일반적인 설명으로 여겨지므로 이것을 명심하십시오. 소행성 예제는 매우 간단합니다.하지만 많은 반복을 통해 일어날 일은 의문입니다.
좀 어리둥절 해?
음, 나는이 초기 지점을 집으로 몰아 넣으려고 gif를 만들었다. NB! 그래프는 나중에 논의 될 것이며, 단지 실험을 시도하고 그림을 그릴 것입니다.
실제 달을 관찰하면 소행성의 양이 많아지면서 관찰 된 분화구 직경이 커져서 가장 큰 분화구 중 20 %가 모든 표면적의 80 %에 접근한다는 것이 밝혀졌습니다.
우리가 더 많은 소행성으로 갈수록 가장 인기가없는 가장 인기있는 그룹의 분포는이 20/80 속성 (파레토 분포)과 함께 일종의 "이상적인 분포"에 접근합니다. 수학을한다면, (일반적으로) 가장 큰 그룹의 크기가 N이고, 두 번째로 큰 그룹의 크기는 N / 2, 세 번째 N / 3 등입니다. 이것은 지프 (Zipf)의 법칙입니다. 이상한 것은 지프 (Zipf)의 법칙이고 파레토 (Pareto) 분포는 엄청난 양의 요소 (소행성)와 그룹 (분화구 클러스터)에서 작동합니다. 물론, 비대칭 및 임의 교란이 있지만 일반적 추세는 부인할 수 없습니다.
소행성이 달에 커다란 크레이터를 타게 될 가능성이 더 큰 소행성이 이미 더 많은 사람들이 살고 있다면 도시가 더 매력적으로 연결되는 것을 볼 수 있기를 바랍니다. 그러나 도시는 Zipf에 따라 행동하는 유일한 "그룹"과는 거리가 멀다는 것을 깨달아야합니다.
다음은 파레토 (Pareto) 배포판에 대한 Mark Newmans 조사의 몇 가지 예입니다. NB! 그래프는 쌍곡선 형태의 곡선을 부드럽게 해주는 로그 - 로그 스케일로 거의 선형 관계를 나타냅니다.
초기 y = aX ^ (- b)
양측의 로그 => log y = log a - b log X
흥미롭게도, 같은 경향이 종교적 종파에 의해서도 드러납니다 ... 이러한 현상의 대부분에 대한 공유 된 속성은 단순히 "큰 집단이 커지는"경향입니다. 따라서 지프의 법칙은 요소의 선호도가 그룹 크기 (즉, 그룹이 커질수록 성장할 가능성이 높음)에 긍정적으로 연결되는 메커니즘에 지속적으로 적용됩니다. 이것이 그룹을 클러스터와 요소로 생각하는 이유입니다.
스팀 시장에서의 Zipf의 법칙
그 마지막 것의 의심스러운? 다음은 Steam에서 가장 인기있는 게임에 사람들이 소비하는 시간입니다. SteamSpy의 데이터.
수학을한다면 가장 인기있는 스팀 게임의 20 %가 총 연주량의 80 %를 차지하므로 파레토 20/80 신비가 매력적으로 작용합니다. Zipf는 사실 이예요. CS : GO 30 %가 아닌 총 시간의 37.5 % / 2 = 18,8 %를 차지할 필요가 있습니다. 그러나이 이상 치를 제외하고 (STOP PLAYING CS : GO), Zipf와 같은 분포가 분명히 존재한다.
다음은 가장 인기있는 게임에 대해 판매 된 사본입니다.
훨씬 멋지네요? 판매 된 사본에는 큰 이상 치가 없으므로 잘 맞습니다. 이는 주목할만한 차이입니다. 그러나 마지막 두 그래프의 차이점에서 결론을 내리는 것이 더 흥미 롭습니다.
두 번째 그래프에서 오른쪽으로가는 "꼬리"가 뚱뚱하다는 것을 알 수 있습니까? 음, 간단히 말해서, 이것은 "상대적으로 인기가없는"게임이 실제로 이전의 음모보다 훨씬 더 대중적이라는 것을 말해줍니다.
실제로 가장 인기있는 게임의 20 %가 매출의 60 %를 차지하는 반면, 80 %는 게임을 차지하는 것으로 나타났습니다. 흥미 롭니? 너는 네 엉덩이에 내기했다.
Steam에 대해 우리는 무엇을 배울 수 있습니까?
글쎄요, 게임의 인기가 파레토 (Pareto) 분포를 따른다는 사실은 플레이어들이 이미 더 많은 사람들이 사용하고있는 게임을 선택하게하는 일종의 긍정적 인 네트워크 효과가 있음을 말해줍니다. 꼬리의 비만의 차이는 스팀 사용자가 게임을 할 때보다는 게임을 구매할 때 훨씬 더 "그룹 크기의 장님"이라는 점입니다.
그것에 대해 생각하십시오 - 더 많은 사람들이 "현재의 대중적 의견"에 관계없이 게임을 구입할수록, 파레토 (Pareto) 배포판이 더 평평 해집니다. 커다란 게임이 더 많이 성장할 가능성이 적기 때문입니다. 얼마나 많은 사람들이 이미 게임을하고 모든 게임의 가용성이 같은지에 대해 쥐를 쥐지 않았다면 가장 인기있는 게임의 20 %가 판매 및 게임 시간의 약 50 %를 차지할 것으로 예상됩니다 (예 : 개별 선호가 정상적으로 배포 됨).
결론
따라서 Steam 시장에서 파레토 (Pareto) 배포에 기여하는 두 가지 요소 - 개발자가 얼마나 혁신적인지 (얼마나 많은 새로운 Moon crater가 형성되는지)와 게이머 (소행성)가 현재 그룹 크기를 얼마나 높이 평가하는지 . 게임을 구매할 때 게이머는 매우 큰 그룹 크기이지만, 게임을 할 때는 그 반대입니다. 응?
지프의 법과 힘의 법칙에 관한 더 자세한 정보는 여기를 클릭하십시오. 또한 Newman의 논문을 꼭보아야합니다!
이런 종류의 것들을 더 읽고 싶다면 조만간이 관찰을 모델에 추가하려고 노력할 것입니다.이 모델은 인기있는 멀티 플레이어 게임의 가격이 높다는 것을 보여줍니다 (더 큰 규모의 그룹에 가입하는 게이머 선호도에 연결됨). 여기에있는 기사를 참조하십시오. Piece De Resistance 기사에서는 멀티 플레이어 게임, 소셜 네트워크 및 도시가 네트워크 효과가있는 모든 반 경쟁 제품 (더 많은 사람들이 제품을 소비할수록 더 많은 개별 소비자 혜택이 있음)을 설명하는 이러한 이론을 함께 시도하고 참여할 것입니다. 수수께끼의이 Zipfian 안개로 그들을 표제 ...
그때까지 - 스스로 즐기십시오!
추신 당신이 생각하는 20/80의 관계에 대한 재미있는 아이디어로 의견을 개진하십시오.
내 위치 :
사람들의 향수의 80 %가 가장 행복한 추억의 20 % (실제로 사람들이 정보를 잊어 버린 비율로 입증 됨)
질량의 80 %는 가장 큰 공간 물체의 20 %에 집중되어 있습니다 (실제로 중력의 분포가 입증 됨)
그리고 물론
변기의 엉망진창 중 80 %는 먹는 것의 20 %에서 나옵니다 (말하기 학문적 연구 없음)