Романов Аркадий Борисович

Романов Аркадий Борисович

Преподаватель дисциплин: Machine Learning, Компьютерное зрение, Визуализация данных, Разработка MVP на базе микроконтроллеров

Занимаюсь преподаванием и разработкой обучающих программ с акцентом на донесение информации с помощью проработанной визуальной составляющей, а также с помощью создания примеров и проведения практики по каждой теме.

Кейсы

1) Принципы работы слоёв для свёрточной нейронной сети

Задача

Сделать понятным механизм работы слоёв, используемых в создании сверточных нейронных сетей.

Целевая аудитория

Студенты, обучающиеся работе с нейросетями, прошедшие материал по полносвязным сетям, и осваивающие тему сверточных нейронных сетей для работы с изображениями.

Цель

Дать пояснение работы сверточных сетей с помощью анимации для максимально полного понимания студентом принципов работы отдельных слоев.

Решение
  • Проработать описание работы следующих слоев: Conv2D, MaxPooling2D, AveragePooling2D, GlobalAveragePooling2D, UpSampling2D, Conv2DTranspose, Flatten;
  • Составить промпты для LLM-моделей;
  • С помощью MML-модели создать JavaScrypt/CSS-анимации высокого качества в едином стиле с интерактивом и пояснениями.

Результат

В результате был создан комплексный материал в едином стиле с единой страницей входа, с которой можно перейти и увидеть работу каждого из заявленных слоёв.

Описания работы слоёв были скорректированы и дополнены для того, чтобы они были максимально понятны студентом с разным уровнем подготовки.

Для некоторых слоёв было решено использовать несколько анимаций, описывающие особенности использования и применения.

Учебный материал был обкатан на студентах, уже прошедших ранее данную тему.

Ссылка на материал: https://role.ru/learning/ai/keras/layers/

2) Разработка учебной программы по теме «Использование LLM для решения практических задач»

Задача

Дать практические знания в области использования технологий Трансформеров и больших языковых моделей (LLM) для студентов, работавших до это с классическими нейронными сетями.

Целевая аудитория

Студенты, обучающиеся работе с нейросетями, знающие основы применения нейросетей для решения задач обработки текстовой информации, и желающие освоить современные подходы на базе LLM.

Цель

Разработать такую учебную программу, которая будет базироваться на ранее полученных студентами знаниях о работе нейросетей, и при этом расширять знания и навыки студентов современными подходами обработки текстов.

Решение
  • Провести анализ того, что именно должно входить в учебную программу;
  • Определить какие моменты необходимо донести более глубоко, а какие можно лишь напомнить, полагаясь на уже полученные студентом знания;
  • Разработать программу, где будет сочетаться теоретический материал, разбор практических примеров, а также необходимые задания для закрепления материала и формирования необходимых навыков.

Результат

В результате была разработана учебная программа на 7 занятий, каждое из занятий продолжительностью 4 академических часа.

Программа подходит для следующих форматов обучения: очно, онлайн, гибрид (очно+онлайн), синхронно

Программа впервые представлена студентам 3 курса колледжа ITHub, обучающихся по дисциплине «Машинное обучение».

Для данной программе также разработан комплект презентаций, а также примеры кода в формате ноутбуков Google Colab

Ознакомиться с учебной программой

3) Разработка ноутбука по теме «Токенизация для современных LLM-моделей»

Задача

Дать возможность студентам перейти от теории токенизации к её практическому применению при использовании современных больших языковых моделей (LLM). Дать понимание экономической составляющей использования токенов при взаимодействии с различными LLM-моделями на английском и русском языках.

Целевая аудитория

Студенты, обучающиеся на курсе «Использование LLM для решения практических задач», и а также все желающие, стремящиеся понять, как именно происходит токенизация текста, каким образом размер токеном влияет на стоимость применения LLM.

Цель

Разработать ноутбук для Google Colab, в котором привести загрузку токенизаторов для популярных LLM-моделей (включая российский GigaChat), подать им на вход тексты на русском и английском языках, и визуализировать результат для максимально понятного восприятия различий. На полученном результате провести дискуссию об экономических аспектах применения LLM.

Решение
  • Провести исследование и выбрать токенизаторы, которые используются в современных языковых моделях;
  • Разработать код ноутбука со следующими блоками:
    1. Загрузка токенизаторов и необходимых библиотек
    2. Получение результатов токенизации (разбиение текста на токены)
    3. Визуализация результатов токенизации
    4. Составление сравнительной таблицы, по которой можно будет сделать выводы и открыть дискуссию со студентами

Результат

В результате был разработан и оформлен ноутбук для Google Colab для пояснения принципов токенизации для современных LLM.

Разработанный ноутбук стал частью разработанных материалов для курса «Использование LLM для решения практических задач».

Ноутбук был использован для в рамках проведения занятий со студентами 3 курса колледжа ITHub, которые обучаются по дисциплине «Машинное обучение».

Ознакомиться с ноутбуком по токенизации.