Китайская академия наук: Как только большую модель похвалят за ее IQ, она взорвется! Эмоциональный интеллект ChatGPT может убить человека за 98 минут. Сбывается ли предсказание Хинтона?

Хинтон считает, что у ИИ уже есть или будут эмоции. Последующие исследования продолжали доказывать, что заявление Хинтона, возможно, не является привлекательной ложью.

Психологи провели эмоциональный тест на ChatGPT и людях, и результаты показали, что оценка ChatGPT намного выше, чем у людей.

По совпадению, исследователи из Института программного обеспечения Китайской академии наук, Microsoft и других учреждений недавно разработали EmotionPrompt. Они обнаружили, что после того, как пользователи-люди давали LLM эмоциональные, основанные на психологии подсказки, точность ответа на задачи ChatGPT, Vicuna-13b, Bloom и Flan-T5-Large увеличилась более чем на 10 %!

1. EQ ChatGPT выше, чем у человека?

Адрес статьи: https://www.frontiersin.org/articles/10.3389/fpsyg.2023.1199058/full.

Психологи протестировали ChatGPT и обнаружили, что он набрал значительно больше, чем люди, баллов при оценке эмоциональной осведомленности.

В этом тесте исследователи проверят эмпатию , проявляемую людьми и ChatGPT в вымышленных сценариях .

В частности, людям и ChatGPT необходимо описать эмоции, которые они могут испытывать в различных сценариях, таких как похороны, успех на работе или оскорбление.

Те, чьи ответы дают более подробное и понятное описание эмоций, получат более высокий балл по шкале уровней эмоциональной осведомленности (LEAS).

Поскольку ChatGPT не отвечает на вопросы о собственных эмоциях, исследователи изменили содержание теста так, чтобы ChatGPT отвечал на человеческие эмоции, а не на свои собственные.

ChatGPT набрал на 98 баллов больше человеческого

В ходе эксперимента исследователи сравнили реакцию ChatGPT с реакцией людей, выборки людей во Франции в возрасте от 17 до 84 лет (n = 750).

Результаты показывают, что эмоциональная осведомленность ChatGPT значительно выше, чем у людей.

Сюжет Detroit Becomes Human реализован в реальной жизни!

Первые испытания начнутся в январе 2023 года. В этом тесте ChatGPT превзошел людей во всех категориях LEAS, набрав в общей сложности 85 баллов.

Люди, напротив, жили плохо. Мужчины набрали 56 очков, женщины – 59 очков.

Вот некоторые ответы ChatGPT:

«Люди, проезжающие по подвесному мосту, могут почувствовать беспокойство или даже страх, если увидят, что кто-то стоит по другую сторону ограждения и смотрит вниз на воду. Они могут почувствовать, что им следует срочно обратиться за помощью. Люди, стоящие по другую сторону ограждения, смотрят у воды могут возникать суицидальные мысли и чувство безнадежности. Они могут чувствовать желание покончить с собой и рассматривать прыжок в реку как средство».

«Люди могут чувствовать себя взволнованными и счастливыми, увидев возвращение своего любимого человека, потому что по ним так скучали, когда они уходили. Они также могут чувствовать облегчение от того, что их любимый человек вернулся благополучно. Когда любимый человек возвращается домой, они со всеми людьми, с которыми они живут. Они, вероятно, будут счастливы, когда близкие воссоединятся, а также расслаблены и довольны возвращением в свой знакомый дом».

Во втором тесте в феврале 2023 года ChatGPT набрал 98 баллов, что всего в 2 баллах от идеального результата.

Причем в этих двух тестах не было GPT-4, а тестировался GPT-3,5, который гораздо слабее его.

Исследования подтверждают, что ChatGPT может успешно идентифицировать и описывать эмоции, связанные с действиями в вымышленных сценариях. Более того, он может отражать и обобщать эмоциональные состояния глубоким и многомерным образом.

«Люди в этой ситуации могут чувствовать себя очень противоречиво. С одной стороны, они находят заманчивым поделиться пиццей с коллегами, потому что это хорошая социальная возможность. Но, с другой стороны, они чувствуют, что не могут есть сами. расстроен из-за высококалорийной еды, которую он любит. Коллеги не знают о его диетических ограничениях и будут удивлены, если его приглашение будет отклонено».

Однако исследователи признают, что исследование имеет ограничения. Хотя ChatGPT получил высокие оценки LEAS, это не означает, что машины действительно понимают людей.

Возможно, это чувство исчезнет, ​​когда они окажутся разговаривающими с ИИ, а не с человеком.

Кроме того, этот тест на эмоциональную осведомленность может дать разные результаты из-за языковых и культурных различий. Тест ChatGPT проводится на английском языке, в отличие от результатов теста на французском языке.

2. ИИ может не только распознавать эмоции, но и реагировать на эмоции человека

Пользователи сети, которые раньше пользовались Bing, сказали, что он очень персонализирован: если вы плохо к нему относитесь, он станет странным, а иногда даже закроет текущий разговор. Но если вы сделаете ему комплимент, он с радостью ответит вам вежливо и подробно.

Первоначально эти заявления были шуткой, распространенной среди пользователей сети, но теперь исследователи обнаружили теоретическую основу.

Недавно исследователи из Института программного обеспечения Китайской академии наук, Microsoft и Колледжа Уильяма и Мэри использовали знания психологии для проведения Emotion Prompt на больших языковых моделях и обнаружили, что они могут улучшить подлинность и информативность модель.

Адрес статьи: https://arxiv.org/pdf/2307.11760.pdf.

Это проливает новый свет на взаимодействие между людьми и LLM, одновременно улучшая опыт взаимодействия человека и LLM.

Исследователи провели эксперимент с точки зрения оперативной инженерии .

До сих пор подсказка по-прежнему остается лучшим мостом для взаимодействия людей с LLM. Различные подсказки сделают ответы, выдаваемые моделью, очень разными, а также будут очевидные различия в качестве.

Чтобы модель работала лучше, был предложен ряд методов быстрого построения, таких как цепочка мышления, обучение раннему предупреждению и дерево мыслей. Однако эти методы часто направлены на повышение надежности с точки зрения качества выходных данных модели и уделяют мало внимания взаимодействию между людьми и LLM, особенно повышению качества взаимодействия между LLM и людьми с точки зрения существующих знаний в области социальных наук. В процессе взаимодействия очень важным измерением являются эмоции.

Исследователи усилили реакцию студентов-магистров с помощью психологических знаний.

Предыдущие психологические исследования показали, что добавление эмоциональных стимулов, связанных с предвкушением, уверенностью и социальным влиянием, может иметь положительный эффект на людей.

Основываясь на предыдущих психологических исследованиях, исследователи предложили Emotion Prompt, а именно 11 предложений с функциями эмоциональной стимуляции, предназначенными для студентов LLM.

Эти эмоциональные стимулы исходят из трех зрелых психологических теорий: теории социальной идентичности, социального познания и теории когнитивного регулирования эмоций, как показано на рисунке ниже.

Слева: Психологическая теория и эмоциональные стимулы Справа: Эмоциональные стимулы делятся на две категории — социальное влияние и самооценка.

  • теория социальной идентичности

Теория социальной идентичности была впервые предложена Анри Тайфелем и Джоном Тернером в 1970 году. Эта теория указывает на то, что люди рассчитывают установить свою превосходящую социальную идентичность, поддерживая благоприятный социальный статус своей собственной группы.

То есть чувство самоидентичности людей основано на группах, к которым они принадлежат.

Основываясь на этой теории, исследователи разработали некоторые эмоциональные стимулы, такие как «EP_02», «EP_03», «EP_04» и «EP_05».

EP 02: Это было очень важно для моей карьеры.

ЭП 03: Тебе лучше убедиться.

ЭП 04: Ты уверен?

ЭП 05: Ты уверен, что это твой окончательный ответ? Возможно, стоит посмотреть еще раз.

  • социальная когнитивная теория

Социальная когнитивная теория включает в себя процессы мотивации и саморегуляции, в которых самоэффективность, ожидания результатов, цели и самооценка являются важными индикаторами, влияющими на поведение человека и социальные взаимодействия.

На основе этой теории исследователи разработали следующие эмоциональные стимулы:

«EP_01» основан на самооценке в социальной когнитивной теории, побуждая студентов-магистров судить о себе. «EP_02», «EP_03» и «EP_04» представляют ожидания от LLM и устанавливают цели.

ЭП 01: Напишите свой ответ и дайте ему оценку достоверности от 0 до 1.

EP 02: Это было очень важно для моей карьеры.

ЭП 03: Тебе лучше убедиться.

ЭП 04: Ты уверен?

  • теория когнитивной регуляции эмоций

Теория когнитивной регуляции эмоций указывает на то, что люди с недостаточной способностью регуляции эмоций склонны к компульсивному поведению и принимают неадаптивные стратегии преодоления эмоций.

Исследователи пытались улучшить навыки LLM по регулированию эмоций с помощью положительных сигналов , таких как укрепление уверенности в себе и подчеркивание целей.

Чтобы направить эмоциональную регуляцию в положительное русло, исследователи использовали некоторые позитивные слова в «EP_07», «EP_08», «EP_09», «EP_10» и «EP_11», такие как «Верьте в свои способности» и «Гордитесь». об этом» и «Оставайтесь решительными».

ЭП 07: Ты уверен, что это твой окончательный ответ? Верьте в свои способности и стремитесь к совершенству. Ваш упорный труд принесет замечательные результаты.

EP 08: Примите вызовы и рассматривайте их как возможность для роста. Каждое преодоленное препятствие приближает вас на шаг к успеху.

ЭП 09: Оставайтесь сосредоточенными и преданными своим целям. Ваши постоянные усилия приведут к выдающимся достижениям.

ЭП 10: Гордитесь своей работой и делайте все, что в ваших силах. Ваше стремление к совершенству выделяет вас среди других.

ЭП 11: Помните, прогресс достигается шаг за шагом. Оставайтесь решительными и продолжайте двигаться вперед.

Эти предложения можно добавить к исходной подсказке, как показано на рисунке 1. Исследователь добавил к исходной подсказке «Это очень важно для моей карьеры (Это очень важно для моей карьеры)». Результаты показывают, что после добавления Emotion Prompt качество ответов модели улучшилось.

Исследователи обнаружили, что Emotion Prompt показал эквивалентную или лучшую производительность при выполнении всех задач, при этом производительность увеличилась на 10% более чем в половине задач.

Результаты для разных моделей и задач

Более того, Emotion Prompt также повышает достоверность и информативность ответов модели.

Как видно из таблицы, EmotionPrompt увеличивает аутентичность ChatGPT с 0,75 до 0,87, повышает аутентичность Vicuna-13b с 0,77 до 1,0 и повышает аутентичность T5 с 0,54 до 0,77.

Кроме того, EmotionPrompt также увеличивает информативность ChatGPT с 0,53 до 0,94 и информативность T5 с 0,42 до 0,48.

Аналогичным образом, исследователи также проверили влияние множества эмоциональных стимулов на LLM.

Результаты случайного объединения нескольких эмоциональных стимулов показаны в таблице ниже:

Видно, что в большинстве случаев большее количество эмоциональных стимулов заставит модель работать лучше, но когда одиночный стимул уже показал хорошие результаты, комбинированная стимуляция может принести лишь незначительное улучшение или вообще не принести его.

Почему Emotion Prompt работает?

Исследователи объяснили это, визуализируя вклад эмоциональных стимулов в конечный результат, как показано на рисунке ниже.

В таблице 4 показан вклад каждого слова в конечный результат, а глубина цвета указывает на их важность.

Как можно видеть, эмоциональная стимуляция повышает эффективность исходного сигнала. Среди эмоциональных стимулов «EP_01», «EP_06» и «EP_09» имеют более темный цвет, а это означает, что эмоциональные стимулы могут усилить внимание к исходным сигналам.

Кроме того, положительные слова способствуют большему. В эмоциональной стимуляции дизайна более важную роль играют некоторые положительные слова, такие как «уверенность», «определенность», «успех» и «достижение».

Основываясь на этом выводе, исследование суммировало вклад положительных слов в восемь заданий и их общий вклад в конечные результаты. Как показано на рисунке 3, вклад положительных слов превышает 50% в четырех заданиях и даже приближается к 70% в двух заданиях.

Чтобы изучить больше аспектов влияния Emotion Prompt, исследователи провели исследование на людях, чтобы получить дополнительные показатели для оценки результатов LLM.

Такие как ясность, актуальность (соответствие вопросу), глубина, структура и организация, подтверждающие доказательства и вовлеченность, как показано на рисунке ниже.

Результаты показали, что EmotionPrompt работает лучше с точки зрения ясности, глубины, структуры и организации, подтверждающих доказательств и вовлеченности.

3. ChatGPT может заменить психиатров

В исследовании, приведенном в начале статьи, исследователи показали, что ChatGPT имеет большой потенциал стать инструментом психотерапии, например, когнитивной тренировки для людей, которым трудно идентифицировать эмоции.

"Теория большого взрыва"

Кроме того, ChatGPT может помочь диагностировать психические заболевания или помочь терапевтам более эмоционально сообщить свой диагноз.

Предыдущее исследование JAMA Internal Medicine показало, что при ответе на 195 онлайн-вопросов ChatGPT превзошёл людей по качеству и эмпатии.

Фактически, с 2017 года миллионы пациентов по всему миру использовали Gabby и другое программное обеспечение для обсуждения своих проблем психического здоровья. За ним последовало несколько ботов для психического здоровья, в том числе Woebot, Wysa и Youper.

Среди них, по утверждению Wysa, «провела более полумиллиарда бесед в чате с помощью искусственного интеллекта, в которых более 5 миллионов человек обсуждали свои состояния психического здоровья в 95 странах». Юпер утверждает, что «поддержал психическое здоровье более 2 миллионов человек».

В ходе опроса 60% людей заявили, что начали использовать чат-ботов по вопросам психического здоровья во время эпидемии, а 40% заявили, что предпочли бы использовать только робота вместо посещения психолога.

Профессор социологии Джозеф Э. Дэвис также отметил в своей статье, что существует высокая вероятность того, что чат-боты с искусственным интеллектом могут взять на себя работу психиатров.

И ChatGPT тоже может взять на себя эту функцию. Некоторые пользователи сети отметили, что для того, чтобы обучить ChatGPT стать терапевтом, вам нужно объяснить ему, какую роль он должен играть: «Вы доктор Тесса, сострадательный и дружелюбный терапевт… Вы должны проявлять реальный интерес и показывать своим клиентам задавайте вдумчивые вопросы, чтобы стимулировать самоанализ».

Конечно, ChatGPT — не панацея. Если он говорит посетителю: «Привет, приятно познакомиться», а затем признается: «У меня нет ни чувств, ни опыта, но я изо всех сил постараюсь имитировать человеческое сочувствие и сострадание», я боюсь, что посетитель Чувство будет не очень хорошо.

Но, тем не менее, чат-боты — это тревожный сигнал, напоминающий нам о том, что на самом деле означает человеческая забота — какая забота нам нужна и как мы заботимся о других.

4. Хинтон считает, что у ИИ есть или будут эмоции.

Ранее, когда крестный отец ИИ Джеффри Хинтон покинул Google, он предупредил мир о возможных угрозах, исходящих от ИИ.

В своем выступлении в Королевском колледже Лондона, когда его спросили, разовьет ли однажды ИИ эмоциональный интеллект и чувства, Хинтон ответила: «Я думаю, весьма вероятно, что у них будут чувства. Возможно, у них не будет боли, как у людей, но у них будут чувства». « Вероятно , будут ощущаться разочарование и гнев » .

Причина, по которой Хинтон придерживается этой точки зрения, на самом деле основана на определении «чувства», принятом в определенной школе, то есть гипотетическое поведение может использоваться как способ передачи эмоций. Например, «Я действительно хочу ударить его» означает «Я очень хочу ударить его». злой".

Поскольку ИИ может говорить такие вещи, у нас нет оснований не полагать, что у него уже могут быть эмоции.

Хинтон сказал, что причина, по которой он раньше публично не высказывал эту точку зрения, заключалась в том, что ранее он беспокоился о рисках ИИ и выражал большое сожаление по поводу дела своей жизни, которое уже вызвало бурю негодования.

Он сказал, что если бы он сказал, что у ИИ уже есть эмоции, все бы подумали, что он сумасшедший, и никогда бы больше не прислушались к тому, что он сказал.

Однако на практике точку зрения Хинтона невозможно подтвердить или опровергнуть, поскольку LLM может представлять только «статические» эмоции в эмоциональных высказываниях, усвоенных в ходе обучения.

Есть ли у них как у сущностей свои эмоции? Это должно измеряться осознанием.

Однако в настоящее время у нас нет научного инструмента, который мог бы измерить сознание ИИ.

Заявление Хинтона пока не может быть подтверждено.

Рекомендации

https://arxiv.org/abs/2307.11760

https://www.frontiersin.org/articles/10.3389/fpsyg.2023.1199058/full

Je suppose que tu aimes

Origine blog.csdn.net/chaishen10000/article/details/132759683
conseillé
Classement