計算社会科学-「科学」記事の翻訳

David Lazer、Alex Pentland、Lada Adamic、Sinan Aral、Albert-LászlóBarabási、Devon Brewer、Nicholas Christakis、Noshir Contractor、James Fowler、Myron Gutmann、Tony Jebara、Gary King、Michael Macy、Deb Roy、Marshall Van Alstyne

翻訳: Xu Xiaoke([email protected]

私たちはさまざまなネットワークに住んでいます。定期的にメールをチェックし、どこにでも携帯電話をかけ、カードをスワイプして移動し、クレジットカードを使用して商品を購入しています。公共の場所では、私たちの行動を監視するためのモニターがあり、病院では、私たちの医療記録がデジタル形式で保存されています。また、オンラインソーシャルネットワークを通じて友情を維持するために、ブログを書く可能性があります。これらすべてがデジタルフットプリントを残しました。これらの痕跡は収束して、個人および集団の行動の複雑な画像になります。同時に、これらの痕跡は、私たちの生活、組織、社会に対する理解も変える可能性があります。

膨大な量のデータを収集して分析する能力は、生物学や物理学などの一部の分野を変えましたが、データ駆動型の「計算社会学」の研究は遅れていました。経済学、社会学、政治学の重要なジャーナルがこの分野に注目することはめったにありませんが、計算社会学はグーグル、ヤフー、米国安全保障省などの国際企業で研究され始めています。計算社会学は、民間企業と政府部門の専有研究分野であるか、または一部の特権研究者が私的データを使用して論文を発表しているが、これらのデータを他者が評価およびコピーすることはできません。上記のシナリオは、間違いなく、知識の蓄積、検証、および配布における一般市民の長期的な利益には役立たない。

オープンな学術環境に基づいて、計算社会学の価値は何ですか?個人の行動や集団行動に対する社会の理解を高めることができますか?計算社会学の発展に対する障害は何ですか?

これまでのところ、人間関係の研究は、主に1回限りの自己申告データに依存してきました。ビデオ監視(1)、電子メール、「スマート」な名前タグなどの新しいテクノロジーは、時間の経過とともにインタラクティブな関係を提供するだけでなく、構造とコンテンツの関係情報も提供します。たとえば、グループ間の相互作用は、電子メールデータを使用して調査できます。時間の経過に伴う人々のコミュニケーションの動的特性に関する質問も調査できます。ワーキンググループが安定してほとんど変更されていないか、または関係が時間の経過とともに劇的に変化したかどうか変化(2)多種多様なグループや個人に対応する相互作用モードの種類(3)は対面のグループコミュニケーションは「社会的測定」によって評価することができ、人々は電子デバイスを身につけて、人々の肉体的な親密さ、場所、動き、その他のさまざまな個人の行動や集団の相互作用を捉えることができます。これらのデータは、組織内の密接な関係やコミュニケーションモード、卓越したパフォーマンスを持つ個人またはグループの情報フローモードなど、多くの興味深い問題の解決に役立ちます(4)

また、ソーシャル「マクロ」ソーシャルネットワーク情報(5)と、それが時間とともにどのように進化するかを理解することもできます。電話会社は数年間、顧客間の通話パターンの記録を保持しており、GoogleやYahooなどのeコマースポータルには、顧客が相互に交換するインスタントメッセージングデータがあります。これらのデータは、ソーシャルコミュニケーションパターンの複雑な図を表すことができますか?これらのインタラクティブな活動のうち、経済生産性や公衆衛生に影響を与えるのはどれですか?いずれにせよ、人間の活動を追跡することは非常に簡単です(6)携帯電話は、人々が肉体的および肉体的に長い間親密であるかどうかを追跡する大規模な方法を提供します(7)これらのデータは、風邪ウイルスなどの病原体が物理的な接触を通じて人々の間でどのように広がるかなど、有用な疫学的洞察を提供する可能性があります。

インターネットは人々が言っているし、どのように人々が一緒に接続されているかを理解するための完全に異なる方法で提供しています(8) たとえば、この直前の政治シーズンでは、ブログスペースでの議論、噂、政治的意見、およびその他の手がかりの広がりを追跡している限り(9)、インターネット上の個々の「サーフィン」行動(10)、すべての有権者何が正確に気にかけているかは明らかです。仮想世界は自然にすべての人の行動を完全に記録することができます。これはまた、多くの実験が現実には不可能で受け入れられない可能性を提供します(11)同様に、ソーシャルネットワークのオンラインサイトは、個人の感情から健康や健康に至るまで、ネットワーク全体における個人の位置が組織全体に与える影響を理解するための独自の方法を提供します(12)自然言語処理は、インターネットやその他のソース(13)上の大量のテキスト資料を整理および分析する機能を継続的に強化し始めています。

つまり、計算社会学は、前例のない方法で収集および分析するデータの幅、深さ、幅を継続的に活用しています。ただし、簡単に克服できない障害がこのプロセスに影響を与えています。現在存在する方法は、数兆の瞬間にわたって変化する人間個人全体の相互関係と位置を処理することができません。たとえば、現在のソーシャルネットワーク理論は、数十人の「スナップショット」から得られたデータを通じて確立されることがよくあります。何百万人もの人々に関するさまざまな情報間の相互関係を知るにはどうすればよいですか。これらの人々の場所、商取引、毎日のコミュニケーションに関するデータ。これらの多数の人と人の相互作用データは、人間の集団行動に関する新しい視点を定量的に提供できますが、現在の研究フレームワークではこれらのデータを処理できません。

 

 

 

uploading.4e448015.gif失敗した転送と再アップロードのキャンセル

ブログスペースから取得したデータ。上の図は、政治ブログコミュニティ間のリンク構造を示しています(2004年以降)。赤い線は保守的なブログを表し、青い線はリベラルなブログを表し、オレンジ色の線は保守的な人に接続されたリベラルなものを表し、紫色の線はリベラルな人に接続された保守的な人を表す。各ブログのサイズは、接続されている他のブログの数を反映しています。[Computing Machinery Associationの許可を得て、ドキュメント8から転載]

計算社会学の進歩を防ぐための制度的な障壁もあります。パスの観点から、物理学と生物学で探究された問題は、観察と干渉により適しています。発見の過程で、クォークや細胞は私たちに彼らの秘密を明かすことを気にしませんし、私たちが彼らの環境を変えるのを妨げません。基本的な構造では、社会学と計算社会学の間のギャップは、生物学と計算生物学の間のギャップよりもはるかに大きくなります。主な理由は、計算社会学には分散型モニタリング、追跡許可、およびコーディングが必要なためです。社会学に利用できるリソースはほとんどなく、物理的な距離や管理形態の観点から見ても、社会学部と工学部または計算部の違いは他の科学よりもはるかに大きくなります。

おそらく最も困難な課題は、個人のプライバシーを保護しながらデータを確実に取得する方法です。多くのデータが所有されています(携帯電話のデータや商取引情報など)。AOLが顧客の「匿名化された」検索レコードの多くを開示したことによる混乱は、個人または企業が民間企業を通じて個人データを共有する潜在的なリスクを強調しています(14)研究を促進し、個人のプライバシーを保護し、企業を保護するためには、産業界と学界の間の協力とデータ共有の堅牢なモデルが必要です。より一般的には、プライバシー問題を適切に処理することが最も基本的です。アメリカ合衆国のNational Research Councilによる地理情報システムに関する最近の報告は、個人情報を頻繁に削除し、データを慎重に匿名化する可能性があることを具体的に指摘しています(15)昨年、米国国立保健サービスとウェルカムトラストは、遺伝子データベースのオンラインアクセス機能の一部を突然削除しました(16)これらのデータは匿名化されているようであり、特定の遺伝子マーカーの全体的な頻度のみを報告します。しかし、調査によると、統計的には、データベース内のすべての個人のすべてのデータが使用された場合でも、個人の身元を再確認することが可能です(17)

プライバシー保護に違反する小さな出来事は、新しいコンピューティング社会学を阻害するシステムと法的規定につながるため、リスクを軽減し、保護するための手順、テクノロジー、ルールに関連する自動調整システムを確立する必要があります潜在的な研究。自己調整システムの基礎として、American Agency Review Boards(IRB)は、侵入と害の潜在的な要因を理解するために科学的および技術的知識を強化する必要があります。これは、現在の害の例では新しい可能性を判断できないためです。多くのIRBは、複雑なデータの匿名化の可能性を評価することが困難です。さらに、IRBは、データセキュリティの保護に焦点を当てた組織を確立する必要があるかどうかを確認する必要がある場合があります。現在、既存のデータは多くの組織に広がっており、これらの組織のデータセキュリティに対する理解と処理方法にはばらつきがあります。研究者は、研究用のデータを保持しながら個人のプライバシーを保護するためにデータを開発する必要があります。同時に、これらのシステムは、業界の顧客のプライバシーとデータセキュリティの保護にも役立ちます(18)

最後に、計算社会学の発展は、新しい学者を養成する方法の開発を必要とする他の新たな学際的主題(持続可能な開発の科学など)とも密接に関連しています。教授の権限を決定する委員会と編集部門は、学際的な取り組みを理解し、報いる必要があります。当初、計算社会学では社会学者と計算科学者の仕事が必要でした。長期的には、この問題は、計算社会学者を訓練するか、計量経済学者と社会文学の計量学者のチームを訓練するかという学界の決定に依存するでしょう。認知科学の出現は、計算社会学の発展の良い例です。認知科学の対象分野には、生物学、哲学、計算科学が含まれます。共有エリアを作成するために多くのリソースを集め、過去の世代の公共財に多大な貢献をしてきました。計算社会学にも同様の可能性があり、同様の投資に値すると私たちは信じています。

 

参照とメモ

1. D. Roy et al。、“ The Human Speech Project” Proceedings of the 28th Annual Conference of Cognitive Science Society、バンクーバー、BC、カナダ、2009年7月26〜29日。

2. JP Eckmann et al。手続き Natl。Acad。サイエンス。USA 101、14333(2004)。

3. S. Aral、M。Van Alstyne、「ネットワーク構造と情報の利点」、アカデミーオブマネジメント会議の議事録、ペンシルバニア州フィラデルフィア、2007年8月3〜8日。

4. A.ペントランド、Honest Signals:どのように私たちの世界を形作るか(MIT Press、ケンブリッジ、MA、2008)。

5. J.-P. Onnela et al。、Proc。Natl。Acad。サイエンス。USA 104,7332(2007)。

6. T.ジェバラ、Y。ソング、K。タダニ、「スペクトルクラスター化と隠しマルコフモデルによる埋め込み」、機械学習に関する欧州会議の議事録、ペンシルバニア州フィラデルフィア、2007年12月3〜6日。

7. MCGonzálezet al。、Nature 453、779(2008)。

8. D. Watts、Nature 445、489(2007)。

9. L.アダミック、N。グランス、リンクディスカバリーに関する第3回国際ワークショップ(LINKDD 2005)、36〜43ページ。http://doi.acm.org/10.1145/1134271.1134277。

10. J. Teevan、ACM Trans。通知します。システム。26、1(2008)。

11. WS Bainbridge、Science 317、472(2007)。

12. K. Lewis et al。、Social Networks 30、330(2008)。

13. C. Cardie、J。Wilkerson、J。Inf。テクノール。政治。5、1(2008)。

14. M.バルバラオ、T。ゼラージュニア、「AOLサーチャーNo. 4417749の顔が露出しています」、ニューヨークタイムズ、2006年8月9日、p。A1。

15. National Research Council、Putting People on the Map:Protecting Confidentiality with Linked Social-Spatial Data、MP Gutmann、P. Stern、Eds。(National Academy Press、ワシントンDC、2007年)。

16. J.フェルチ。「公衆からブロックされたDNAデータベース」、Los Angeles Times、2008年8月29日、p。A31。

17. N.ホーマー、S。セゼリンガー、M。レッドマン、D。ダガン、W。テンベ、PLoS Genet。4、e1000167(2008)。

18. MVAは、通信コンテンツのプライバシーを保護するためのアルゴリズムに関する特許を申請しています。

19.計算社会科学のその他のリソースは、サポートするオンライン資料にあります。

元の150件の記事を公開 賞賛された149件 810,000回

おすすめ

転載: blog.csdn.net/chaishen10000/article/details/105285430