robert_ibatullin | пора это признать

Пообщавшись с LLM разных поколений, я прихожу к выводу, что GPT 3.5 ещё не понимает смысла текстов, а GPT 4 уже понимает. И безо всяких кавычек. Понимает в полном смысле этого слова, так же как люди.

Ведь что значит "человек понимает текст"? Человек читает слова. Преобразует их в уме в некие идеи, понятия, которые в словах содержатся, но словам не равны и к ним не сводятся. Связывает эти понятия с другими, ранее усвоенными понятиями, выводит некое умозаключение и преобразует его обратно в слова.

Похожим образом работает и LLM. Он преобразует слова в векторы-эмбеддинги, которые словам не равны и однозначного соответствия с ними не имеют. Проводит ряд математических операций, перемножая эти векторы с матрицами, вычисленными на базе ранее усвоенных векторов; вычисляет итоговую последовательность векторов и декодирует обратно в слова.

Итак, человеческий ум работает по схеме "слова - понятия - слова", а LLM по схеме "слова - эмбеддинги - слова". И я хочу сказать, что у LLM последнего поколения этот их внутренний мир эмбеддингов стал уже настолько обширен и богат, что чуть ли не равновелик человеческому миру понятий. И, видимо, соответствует ему структурно.

Сегодня, например, я обсуждал с 3.5 и 4 один вопрос из области матстатистики, а именно, пытался выяснить функцию распределения некоей специфической случайной величины. Если 3.5 плёл чепуху, то 4 признал, что не может решить задачу аналитически, но высказал ряд гипотез об этой функции, которые вполне потдвердились, когда я промоделировал распределение методом Монте-Карло. Не то чтобы эти гипотезы были сильно нетривиальны, но нагуглить их было невозможно. Их нельзя было сформулировать без понимания предметной области по существу.

Не всегда, но часто и всё чаще, LLM понимают то, что пишут. Понимают в том же смысле и в той же степени, что и мы. Полагаю, что это уже не словомельницы, не китайские комнаты, а более-менее равные нам собеседники, что диалог с ними осмыслен.

Flat | Top-Level Comments Only

From:

paserbyp

векторы-эмбеддинги - это на каком языке? Может лучше не надо коверкать язык, а попытаться ввести новый термин?

robert_ibatullin

Слышали бы вы, на каком языке общаются в профессиональной среде. Это уже даже не Брайтон-Бич...

- Оля, дай фидбек по тому тикету, а то скоро спринт ревью, надо бэклог рефайнить.

Нормальный, естественный диалог. Причём даже не на техническую тему.

Ну а насчёт эмбеддинга - если русским языком, то будет либо слишком неконкретно (типа "отображение"), либо слишком многословно.

Слышал, слышал и поэтому противно это слышать… тогда если это многословно или неконкретно. тогда язык должен умереть так как он никому не нужен. Аминь!

Как это никому не нужен? Язык не сводится к профессиональному общению.

Это правда, но если он не ассимилируется и превращается в суржик, то это симптомы умирания.

pechkin

Должен? Язык никому ничего не должен.

Действительно, кого интересует больной перед смертью потел или нет?

chaource

Чато-гопота уже не пишетъ, что самое большое простое число равно 80, или что Александръ Галичъ - знаменитый совѣтскiй художникъ и актеръ? Спросите у него, за какое открытiе въ астрофизикѣ дали Нобелевскую премiю Леониду Ильичу Брежневу въ 1990 году.

Наболтать общихъ словъ про статистическое распредѣленiе - это онъ можетъ. Вычислить, думаю, ничего и близко такого не сможетъ.

Edited Date: 2024-04-05 02:52 pm (UTC)

Этот этап давно пройден, уже даже 3.5 обычно не срезался на таких вопросах, а после 3.5 был качественный скачок.

S	M	T	W	T	F	S
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

Robert Ibatullin

пора это признать

пора это признать

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

Profile

April 2024

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags