Многие люди используют технологии искусственного интеллекта практически каждый день, даже не подозревая об этом. Этот термин относится к программам, которые используют, например, Google Maps или интернет-переводчики. Языковые модели, такие как чатбот ChatGPT, также привлекли к себе внимание в последнее время. Искусственный интеллект - это машинное обучение, а название - скорее маркетинговая уловка, говорит Давид Герел из Чешского технического университета.
"Например, раньше компьютеры работали иначе, чем сейчас. Сейчас они работают по принципу нейронных сетей. Они не могут искать или редактировать текст, они научились только переводить", - говорит Герел. "Языковая модель работает по принципу своеобразного черного ящика, который пытается угадать следующее слово, что он и делает на основе данных в интернете", - добавил он.
ChatGPT и ему подобные могут показаться Герелу мыслящей машиной, но это всего лишь программа, которая пытается угадать каждое следующее слово. Поэтому, если она не знает, что за чем следует, она может выдумывать. Это зависит от того, какие обучающие данные есть у языковой модели. "Разработчики могут сильно модифицировать модель, и это во многом зависит от того, на каких данных основана модель. По этой причине каждая модель может отличаться от другой", - говорит он.
По словам Герела, проблема с языковыми моделями заключается в том, что они обучаются с запаздыванием. Все, что происходит позже, чем в обучающих данных, модель не знает и придумывает. Но большинство компаний, разрабатывающих языковые модели, не раскрывают эту информацию, поскольку считают ее коммерческой тайной. Чем лучше данные, тем лучше конечный продукт, и они не раскрывают эту информацию из-за конкуренции.
Самое интересное в языковых моделях то, что так называемые ролевые игры работают очень хорошо. Например, человеку дают задание написать ответ на вопрос в роли школьника или, наоборот, академика. Герел объясняет это тем, что модель также извлекает контекст из данных.
"Если вы скажете ему написать рассказ, он напишет его как обычный человек. Однако когда вы поручаете ему написать ее как восьмилетний ребенок, он опирается на данные и знает, как пишут восьмилетние дети, и поэтому, скорее всего, создаст историю как восьмилетний ребенок", - говорит Герел, добавляя, что именно в понимании контекста и заключается магия языковых моделей. "Вот почему он способен различать такие слова, как крона как объект и крона как валюта", - добавил он.
"Большинство ученых, как правило, работают над математическими моделями, нейронными сетями и технологиями, которые мы имеем сегодня. Сообщество людей, разрабатывающих ИИ с самосознанием, например, очень мало. До сих пор этот подход был неудачным и не приносил прибыли", - пояснил Герел, который в настоящее время работает над технологией, идея которой заключается в использовании моделей на основе ИИ для выявления общественного мнения по данным интернета.