Как работает ИИ

Прежде чем углубляться в остальную часть курса, важно усвоить некоторые фундаментальные понятия о различных ИИ и их функционировании. Эти фундаментальные знания обеспечат более четкое понимание последующего материала.

Разные ИИ

Ландшафт искусственного интеллекта огромен и разнообразен , охватывая тысячи, если не миллионы, различных моделей. Эти модели обладают широким спектром возможностей и применений. Некоторые из них являются генеративными и предназначены для создания таких результатов, как изображения , музыка , текст и даже видео . Напротив, другие являются дискриминационными и предназначены для классификации или различения различных входных данных, например, классификатор изображений, различающий кошек и собак. Однако этот курс будет сосредоточен исключительно на генеративном ИИ.

Среди генеративных ИИ лишь немногие избранные обладают расширенными возможностями, которые делают их особенно полезными для оперативного проектирования. В этом курсе мы в первую очередь сосредоточимся на ChatGPT и других моделях больших языков (LLM). Методы, которые мы исследуем, применимы к большинству программ LLM.

По мере того, как мы углубляемся в область генерации изображений, мы исследуем использование Stable Diffusion и DALLE .

Снимок 21.11.2023 в 16.50.jpeg

Генеративные текстовые ИИ, такие как GPT-3 и ChatGPT, работают на основе сложного типа нейронной сети, известной как архитектура преобразователя. Эта архитектура состоит из миллиардов искусственных нейронов. Вот несколько ключевых моментов, которые нужно понять о том, как работают эти ИИ:

По своей сути эти ИИ представляют собой математические функции. Вместо простой функции типае х Икс

ж(Икс)=Икс2

(

)

=

2

думайте о них как о функциях с тысячами переменных, приводящих к тысячам возможных результатов.
Эти ИИ обрабатывают предложения, разбивая их на единицы, называемые токенами, которые могут быть словами или подсловами. Например, ИИ может читаться I don't like"I", "don", "'t", "like"

как

. Каждый токен затем преобразуется в список чисел для обработки ИИ.
ИИ генерируют текст, предсказывая следующий токен на основе предыдущих. Например, после I don't likeapples

ИИ может предсказать

b

. Каждый новый токен, который они генерируют, находится под влиянием предыдущих токенов.
В отличие от людей, которые читают слева направо или справа налево, эти ИИ рассматривают все токены одновременно.