Задание
Участникам предстоит обучить нейросеть новым знаниям. Нейросеть попалась достаточно сообразительная, но сведения о внешнем мире она может подчерпнуть только из предоставленной информации – датасета
Датасет представляет собой структурированный текстовый файл, содержащий конкретные определения, факты или описания связанные с некоторой областью знаний (так называемые чанки, chunks)
Сформированный датасет загружается в нейросеть, и после его анализа ИИ способен отвечать на вопросы, связанные с выбранной темой датасета.
Но, если качество подготовки датасета оставляет желать лучшего – формулировки не полные, описания не четкие, сведения противоречивые и содержат фактические ошибки – нейросеть начинает галлюцинировать. Простыми словами молоть полную ерунду.
Задача участников – собрать, обработать и структурировать комплект чанков, «научив» ИИ правильно отвечать на поставленные вопросы.