ロボットが顔を見て「心」を読むように訓練することは本当に信頼できますか?

Yunqi情報:[ クリックして他の業界情報を表示 ]
ここでは、さまざまな業界の直接のShangyun 情報を見つけることができます。

人工知能企業は顔の感情認識ソフトウェアを積極的に宣伝していますが、心理学者は感情認識は言うよりも簡単だという疑問を抱いています。

何百もの顔が画面上で1つずつ点滅し、中には目を見つめていたものもあれば、しぼんだものもあり、目を閉じていたり、口を上げていたり、口を大きく開いていたりするものもありました。これらの顔を見て、あなたは簡単な質問に答えなければなりません:この人はオルガスムや痛みを経験していますか?

画像
来源:GL Archive / Alamyより転載

2018年、心理学者のレイチェルジャックとその同僚は、このテストを行うために80人を採用しました。英国のグラスゴー大学のチームは、長年の熱い疑問を研究するために、西アジアおよび東アジアからこれらの参加者を採用しました:表情は本当に感情を伝えることができますか?

研究者は、さまざまな国の大人と子供、さらには遠隔地の先住民族を含め、何十年にもわたって顔の感情を読むよう被験者に求めてきました。1960年代と1970年代に、アメリカの心理学者Paul Ekmanが行った有名な観察研究では、世界中の人々が表情の背後にある感情を正確に推測できることがわかりました。これは、感情の表情が相互に関連していることを示しています。

この見解は、基本的に世代にとって挑戦的ではありません。しかし、新世代の心理学者や認知科学者は、これらのデータを検討した後に疑問を呈しました。現在、多くの研究者は、実際の状況ははるかに複雑であり、表情はさまざまな状況や文化で非常に異なる意味を持っていると信じています。たとえば、ジャックの研究では、西洋人と東アジア人は痛みを表す表情について同様の理解を持っていますが、どの表情が喜びを表すかについては同意していません。

人間の顔は感情的な表現の窓であるというEkmanの結論については、研究者間の違いが大きくなっています。しかし、これは商業企業や政府が彼の主張を「支払い」、人々の運命を変えるような方法で適用することを妨げるものではありません。たとえば、西側の多くの司法制度では、被告の感情を読むことは公正な裁判の一部です。アメリカ合衆国最高裁判所の正義のアンソニーケネディは、1992年に「犯罪者の心と考えを理解するために」これが必要であると書いたことがあります。

エクマンは、2007年に開始された米国交通安全局(TSA)向けに物議を醸すトレーニングプログラムを設計しました。その中心は感情を解釈することです。このプロジェクトは「観察技術による乗客のスクリーニング」(SPOT)と呼ばれます。主な目的はTSA担当者を訓練し、乗客に現れる数十の疑わしい兆候を監視することです。これらの兆候は不安、欺瞞、恐怖を反映している場合があります。感情。このプロジェクトは、科学者、議会のメンバー、アメリカ市民自由連合などの市民社会組織から広く疑問視されており、このアプローチは不正確であるとして非難され、人種的偏見ももたらしました。

疑わしい声が続いてもトップのテクノロジー企業は止まらず、感情は簡単に検出できると信じており、その中には感情認識ソフトウェアを開発している人もいます。現在、これらのソフトウェアはテストまたは宣伝されており、アプリケーションの範囲には、求職者と職位のマッチングの評価、うそ発見、広告の魅力化、認知症からうつ病までのさまざまな病気の検出が含まれます。

この業界の評価額は数百億ドルにも上ります。マイクロソフト、IBM、アマゾンなどのテクノロジーの巨人、さらにいくつかの専門企業(ボストンのAffectivaやマイアミのNeuroData Labなど)は、顔を通して感情を検出するアルゴリズムを導入しています。

研究者たちは、人間の顔が感情を忠実に表現し、知覚できるかどうかについてまだ議論を続けています。多くの専門家は、特にこの技術は潜在的に破壊的であるため、コンピュータを使用して感情を自動化するのは時期尚早だと考えています。ニューヨーク大学のAI Now Instituteの研究センターは、求人や法執行機関などのデリケートな環境での感情認識技術の使用の禁止を求めました。

関連研究に従事しているオハイオ州立大学の研究者であるAleix Martinez氏は、人間自身であっても人間の顔の表情を解釈するのは難しいと述べました。これを考慮すると、すべてを自動化できるという現在の傾向と合わせて、「心配する必要がある」と述べた。

浅見

人間の顔には43の筋肉があり、伸ばしたり、持ち上げたり、ねじったりして、数十の異なる表情を表現できます。顔の筋肉は多くの行動をとることができますが、科学者は常に特定の表情が特定の感情に対応すると信じています。

この見方をする人にはダーウィンも含まれる。1859年に彼は野外調査の傑作「種の起源」を観察の教科書と呼ぶことができる出版した。彼の影響力の少ない作品のもう1つである「人間と動物の感情表現」(1872年)は、かなり独断的です。

ダーウィンは、霊長類の顔の動きが人間の感情の表現(嫌悪感や恐怖など)にいくらか似ていることに気づきました。彼はこれらの表現が何らかの適応機能を持たなければならないことを提案しました。たとえば、口を膨らませたり、鼻にしわを寄せたり、目をつぶしたりするなど、嫌悪感に関連する表現は、もともと有害な病原菌から身を守るためのものでした。これらの表情がコミュニケーションにおいて役割を果たすようになったのは、社会的行動の出現によってのみでした。

画像
ダーウィンの感情に関する言説には、痛みを伴う対象を模倣しようとした人など、多くの振り子の表現が含まれていました。出典:アラミー

1960年代にエクマンが実施した異文化フィールド研究の最初のバッチは、ダーウィンの仮説を支持しました。彼は世界中の人間の表現と6つの主要な感情(幸せ、悲しい、怒り、怖い、驚いた、そしてうんざりしている)の知覚を研究しており、ニューギニアの遠隔部族も含まれています。

エクマンはネイチャーに、彼はこれらの6つの感情を実際的な考慮から選んだと語った。恥ずかしさや罪悪感など、明確な表現がない感情もあり、「私が焦点を当てている6つの感情は表現力豊かで、研究対象として使用できる」と述べた。

エクマンは、これらの初期の研究がダーウィンの進化論によって拡張された普遍的な表現理論をサポートしていると考えています。その後の研究で、いくつかの顔の表情には適応的な利点があることが証明されました。

ボストンのノースイースタン大学の心理学者であるリサフェルドマンバレット氏は、「長い間、人々は顔の表情は必須の行動であると考えています。」つまり、私たちの顔は私たちの感情を隠すことはできません。しかし、この仮定の明らかな抜け穴は、人々が実際に感情を偽造したり、感情を顔から遠ざけたりする可能性があることです。エクマンの学者たちはまた、それぞれの感情を表現するためのいわゆる「ゴールドスタンダード」がないことを認めています。

ますます多くの研究者が、感情に対応する表現の範囲が非常に大きいため、ゴールドスタンダードの概念がほとんど崩れていることを示唆しています。彼らはこの見解を大きなまとめで支持した。数年前、ジャーナルPsychological Science in the Public Interestの編集者は、相互に排他的な著者を招待して、このレビューを完了するために専門家のパネルを形成しました。

コラボレーションを主導したバレット氏は、「私たちは先見の明を捨てるために最善を尽くします。」彼らは事前に想定をせず、データから直接始めました。彼女は、「見解が統一されない場合、新しい証拠を探します。」最後に、彼らは約1,000の論文を読み、2年半の研究の後に、彼らは非常に明白な結論に達しました:証拠がない、または非常に人々がさまざまな顔の動きから誰かの感情的な状態を推測できることを証明する証拠はほとんどありません。

画像
顔に反映される感情は非常に限られています

これらの研究者は、顔の動きが内部の感情と関連していないことを証明するいくつかの研究を引用しています。イギリスのデモンフォート大学の心理学者であるカルロスクリヴェリは、パプアニューギニアのトロブリアンド諸島の居住者を調査しましたが、エクマンの見解を支持する証拠は見つかりませんでした。クリヴェリの結論は、外部のパフォーマンスから内部の精神状態を推測することは、定規で重さを量るようなものだということです。

表現の普遍性を証明する証拠が不足しているもう1つの理由は、顔が情報の一部しか提供していないことです。身体の動き、性格、口調、顔の変化などの他の情報も、感情を認識して表現するプロセスで重要な役割を果たします。気分の変化が血流に影響を与えるように、血流は顔色に影響を与えます。マルチネスと同僚は、人々が顔の変化と感情の関係を発見できることを発見しました。また、背景などの視覚信号も、感情的な状態を識別するための手がかりを提供します。

画像
左上から:バスケットボール選手のザイオンウィリアムソンがスラムダンクを祝い、メキシコのファンがワールドカップグループステージのプロモーションを祝い、歌手アデルが2012年にグラミー賞を受賞しました。ジャスティンビーバーのファンがメキシコシティでのコンサートで泣きました。

複雑な感情

他の研究者は、エクマンの結論への反撃は少しやり過ぎだったと指摘しました。エクマン自身は当然のことと考えた。2014年、バレットの批判に応えて、彼は自分の以前の結論を裏付ける多数の研究があると指摘しました。これには、顔が自然に表情を表現することを証明する研究が含まれます。他の研究は、顔の表情と脳と体の状態との間の関係を発見しました。彼の応答で、彼はこれらの研究が顔の表情が人間の感情だけでなく神経生理学的活動のパターンも反映することを示すと言ったと言った(go.nature.com/2pmrjkhを見てください)。彼の意見は変わっていないと述べた。

カナダのブリティッシュコロンビア大学の心理学者であるジェシカトレーシーによると、エクマンの表現普遍主義が間違っていると信じている人々によって与えられた証拠はほんの一部の反例であり、彼らは誇張しています。

彼女は、異なるグループや文化が怒りの表現を少し誤解したとしても、理論全体を覆すことはできないと信じています。ほとんどの人はこれが一見怒っている顔であることを知っており、彼女は100件の研究の分析を引用しています。彼女は言った:「世界中のほとんどの文化のほとんどの人々がこの表現が普遍的であると思うという他の多くの証拠があります。」

トレーシーと他の3人の心理学者は、バレットが6つの感情と顔の動きに厳密に対応していると文献レビューで述べていると信じていますが、この解釈は少し誇張されています。著者の一人、アムステルダム大学のDisa Sauter氏は、「彼女に同意する感情科学の分野の他の研究者はいないと思う」と述べた。

ソーターとトレーシーは、表情を解釈するには感情のより複雑な分類が必要であると信じています。研究者は幸福を単一の感情として扱うのではなく、それを細分化し続けます。幸福には、幸福、喜び、哀れみ、誇りなども含まれます。これらの感情の表現は、異なる場合や重複する場合があります。

1
一部の研究では、コンピューターを使用してランダムな式を生成しています。レイチェルジャックが2018年に実施した調査では、参加者は、各顔が痛みやオルガスムの定義にどれだけよく合っているかを示す必要があります。出典:C. Chen et al./PNAS(CC by 4.0)

この論争の核心は、実際には識別性の定義です。ある研究では、参加者は、見た顔を説明する6つの感情タグの1つを選択する必要がありました。一部の研究者は、特定の式が選択される確率が20%より大きい場合、それはこの式がより用途が広いことを意味すると考えているかもしれません。

20%の標準が緩すぎると感じる人もいます。ジャックはエクマンのしきい値が低すぎると考えています。博士は博士号の期間中にエクマンの初期の論文を読みました。「私は常にメンターのところに行き、これらの60年代と70年代のチャートを見せています。各チャートは文化的に認識されています。大きな違いがありますが、現時点では、感情の認識が普遍的であることを証明するデータはまだありません。」

顕著性が考慮されていない場合でも、研究者は主観性の問題に直面する必要があります。多くの研究では、実験後に感情を比較できるように、感情に事前にラベルを付ける必要があります。したがって、バレット、ジャック、および他の学者は、より客観的な方法で感情を研究したいと考えています。バレットは生理学的指標を研究しており、彼女はそれらを使用して怒り、恐れ、喜びを説明したいと考えています。

ジャックは、顔写真の代わりにコンピューター生成の表現を使用して、最も一般的な6つの感情に限定されることを回避します。研究者はまた、参加者に自分で顔を分類するよう依頼するか、異なる文化の参加者に母国語で写真にタグを付けるよう依頼しました。

シリコンベースの感情

ソフトウェア会社はアルゴリズムの自由な関連付けを避けます。一般に、感情認識のための人工知能アルゴリズムは、何百万もの顔画像と何百時間ものビデオを学習する必要があります。それぞれの感情にラベルが付けられ、これらの素材からパターンを学習します。Affectivaは、同社がこのソフトウェアをトレーニングしたのは87か国から700万人以上の顔であり、その感情認識の正確度は90%に達しています。

同社はアルゴリズムの背後にある科学的根拠の開示を拒否した。Neurodata Labは顔の表情の違いを認識しましたが、「誰かが特定の感情を経験している場合、特定の顔の表情の可能性はランダムな確率よりも高くなります」と指摘し、会社のアルゴリズムは正確にこの法律。意見が統一されていない研究者は、どこにいても、この種のソフトウェアに懐疑的です。トレーニングアルゴリズムで使用されるデータについて心配しているのか、それとも分野がまだ決定的でないと考えているのか、です。

エクマン氏は、これらの企業に直接挑戦したと述べた。彼はいくつかの会社に手紙を書いたが、「彼らは世界最大のソフトウェア会社である」とだけ言って会社の名前を明らかにすることを拒否し、自動化技術が効果的であるという証拠を彼らに求めたが、返答は得られなかった。彼は言った、「私の意見では、彼らの理論は証拠によってサポートされていません。」

マルチネスは折衷的に言って、自動化された感情認識はグループの平均的な感情的反応を表すことができるかもしれないと言いました。Affectivaは、特定の消費者の製品またはマーケティングツールに対する反応を予測できるように、ソフトウェアをマーケティング代理店および特定のブランドに販売しています。

このソフトウェアが間違っていても、それほど大きな影響はなく、ほとんどの広告の効果は期待どおりではありません。ただし、いくつかのアルゴリズムの適用は、インタビューや国境調査など、人々の運命を変える可能性があります。昨年、ハンガリー、ラトビア、ギリシャは、乗客の事前スクリーニングシステムを使用して、顔の微小な表情を分析して嘘を分析しました。

この感情表現の議論を落ち着かせるには、さまざまな研究方法が必要です。バレットはしばしば彼女の研究をテクノロジー企業に紹介するよう招待され、つい最近までマイクロソフトに行ったばかりでした。彼女は、研究者はダーウィンの「種の起源」を書く方法を実践する必要があると信じています。「観察、観察、再観察」実験室だけでなく、現実の人々が顔と体を通して情報を伝達する方法を観察します。次に、マシンを使用して、実際の生活の画像を記録および分析します。

バレットは、古いデータや実験をレビューするのではなく、より多くのデータや分析手法が研究者が新しい知識を得るのに役立つと信じています。彼女と他の研究者は耐えられないように見えるこの科学のために、多くのテクノロジー企業が試してみたいと熱望しています。彼女はこれらの企業に挑戦しました:「私たちは崖に達し、人工知能企業が抜け穴に満ちた研究仮説を使い続けるかどうか、または何をすべきか?」

[雲旗オンライン教室]毎日、製品技術の専門家が共有しています!
コースアドレス:https : //yqh.aliyun.com/live

今すぐコミュニティーに参加し、専門家と顔を合わせて、コースの最新の動向に遅れないようにしてください!
【Yunqiオンライン教室コミュニティ】https://c.tb.cn/F3.Z8gvnK

オリジナル発行日:2020年4月9日
著者:自然、自然科学
からの記事:「学術見出し情報については、」「に関することができる学術見出しを

このコミュニティに盗用の疑いがあることが判明した場合は、yqgroup @ service.aliyun.comに電子メールを送信して、関連する証拠を報告および提供してください。確認後、コミュニティは侵害の疑いのあるコンテンツを直ちに削除します。

元のリンク
この記事はYunqiコミュニティの元のコンテンツであり、許可なしに複製することはできません。

元の記事2315件を公開 2062件のいいね 158万回

おすすめ

転載: blog.csdn.net/yunqiinsight/article/details/105497148