Прежде чем углубляться в остальную часть курса, важно усвоить некоторые фундаментальные понятия о различных ИИ и их функционировании. Эти фундаментальные знания обеспечат более четкое понимание последующего материала.

Разные ИИ

Ландшафт искусственного интеллекта огромен и разнообразен , охватывая тысячи, если не миллионы, различных моделей. Эти модели обладают широким спектром возможностей и применений. Некоторые из них являются генеративными и предназначены для создания таких результатов, как изображения , музыка , текст и даже видео . Напротив, другие являются дискриминационными и предназначены для классификации или различения различных входных данных, например, классификатор изображений, различающий кошек и собак. Однако этот курс будет сосредоточен исключительно на генеративном ИИ.

Среди генеративных ИИ лишь немногие избранные обладают расширенными возможностями, которые делают их особенно полезными для оперативного проектирования. В этом курсе мы в первую очередь сосредоточимся на ChatGPT и других моделях больших языков (LLM). Методы, которые мы исследуем, применимы к большинству программ LLM.

По мере того, как мы углубляемся в область генерации изображений, мы исследуем использование Stable Diffusion и DALLE .

Снимок 21.11.2023 в 16.50.jpeg

Генеративные текстовые ИИ, такие как GPT-3 и ChatGPT, работают на основе сложного типа нейронной сети, известной как архитектура преобразователя. Эта архитектура состоит из миллиардов искусственных нейронов. Вот несколько ключевых моментов, которые нужно понять о том, как работают эти ИИ:

  1. По своей сути эти ИИ представляют собой математические функции. Вместо простой функции типае х Икс

    ж(Икс)=Икс2

    (

    )

    =

    2

    думайте о них как о функциях с тысячами переменных, приводящих к тысячам возможных результатов.

  2. Эти ИИ обрабатывают предложения, разбивая их на единицы, называемые токенами, которые могут быть словами или подсловами. Например, ИИ может читаться I don't like"I", "don", "'t", "like"

    как

    . Каждый токен затем преобразуется в список чисел для обработки ИИ.

  3. ИИ генерируют текст, предсказывая следующий токен на основе предыдущих. Например, после I don't likeapples

    ИИ может предсказать

    b

    . Каждый новый токен, который они генерируют, находится под влиянием предыдущих токенов.

  4. В отличие от людей, которые читают слева направо или справа налево, эти ИИ рассматривают все токены одновременно.