Прежде чем углубляться в остальную часть курса, важно усвоить некоторые фундаментальные понятия о различных ИИ и их функционировании. Эти фундаментальные знания обеспечат более четкое понимание последующего материала.
Ландшафт искусственного интеллекта огромен и разнообразен , охватывая тысячи, если не миллионы, различных моделей. Эти модели обладают широким спектром возможностей и применений. Некоторые из них являются генеративными и предназначены для создания таких результатов, как изображения , музыка , текст и даже видео . Напротив, другие являются дискриминационными и предназначены для классификации или различения различных входных данных, например, классификатор изображений, различающий кошек и собак. Однако этот курс будет сосредоточен исключительно на генеративном ИИ.
Среди генеративных ИИ лишь немногие избранные обладают расширенными возможностями, которые делают их особенно полезными для оперативного проектирования. В этом курсе мы в первую очередь сосредоточимся на ChatGPT и других моделях больших языков (LLM). Методы, которые мы исследуем, применимы к большинству программ LLM.
По мере того, как мы углубляемся в область генерации изображений, мы исследуем использование Stable Diffusion и DALLE .
Генеративные текстовые ИИ, такие как GPT-3 и ChatGPT, работают на основе сложного типа нейронной сети, известной как архитектура преобразователя. Эта архитектура состоит из миллиардов искусственных нейронов. Вот несколько ключевых моментов, которые нужно понять о том, как работают эти ИИ:
По своей сути эти ИИ представляют собой математические функции. Вместо простой функции типае х Икс
ж(Икс)=Икс2
(
)
=
2
думайте о них как о функциях с тысячами переменных, приводящих к тысячам возможных результатов.
Эти ИИ обрабатывают предложения, разбивая их на единицы, называемые токенами, которые могут быть словами или подсловами. Например, ИИ может читаться I don't like"I", "don", "'t", "like"
как
. Каждый токен затем преобразуется в список чисел для обработки ИИ.
ИИ генерируют текст, предсказывая следующий токен на основе предыдущих. Например, после I don't likeapples
ИИ может предсказать
. Каждый новый токен, который они генерируют, находится под влиянием предыдущих токенов.
В отличие от людей, которые читают слева направо или справа налево, эти ИИ рассматривают все токены одновременно.