Привет всем ценителям компьютеров и искусственного интеллекта! Хотелось бы рассмотреть новинку в сфере ИИ: автономный чат-бот GPT4All
Искусственные мозги
История нейросетей началась куда раньше, чем многие думают. Теория нейросетей была затронута в 1943 году, когда американские учёные-математики Уоррен Маккалок и Уолтер Питтс реализовали крупный доклад о модулировании мышления. Учитывая техническую ограниченность вычислительной техники тех времен, они предложили проводить опыты на ламповых ЭВМ.
Фото: pinimg.com
Все подобные чат-боты являются языковыми моделями (Language Model, LM). И знаете, где вы могли столкнуться с языковыми моделями? В вашем мобильном телефоне! T9 - функция предикативного ввода, предлагающая слова по контексту, а также по начальным буквам, изначально основанная для кнопочных телефонах, что отражено в названии - у таких устройств было 9 кнопок, позже на её основе созданы более мощные языковые модели под сенсорные КПК, где раскладка клавиатуры аналогична компьютерной. В такие языковые модели зашиты собственно слова, наиболее частые словосочетания, можно "тренировать" Т9 посредством добавления новых слов, а позднее подобные языковые модели научились запоминать наиболее употребимые слова и словосочетания конкретным пользователем.
Что ты такое
Данный чат-бот основан на технологиях GPT-J и Llama. Базовая модель нейросети натренирована на 437 тысяч запросов, поддерживается также тренировка вручную на основе разнообразных моделей данных.
Давайте приступим!
Для того, чтобы развернуть данную нейросеть не придётся прибегать к каким-то особо-сложным шагам: разработчик создал удобные инсталляторы для Windows, Linux и Mac OS, в которых уже заложены все необходимые установочные файлы, а также порядок их развертывания.
Модель очень компактная, поддерживает удобный web-интерфейс и занимает от 4 Гб дискового пространства.
Фото: githubusercontent.com
К сожалению, нейросеть пока что имеет проблемы с русским языком, официальная поддержка великого и могучего пока не заявлена. Скорее всего, в ответ на запрос на русском языке вы получите полный бред, с чем столкнулся пользователь Хабра (https://habr.com/ru/articles/730538/), но при желании можно попробовать натренировать сеть вручную на русскоязычных текстах.
Для тренировки нейросети требуются некоторые навыки программирования, информация на этот счёт есть на GitHub проекта (https://github.com/nomic-ai/gpt4all).
Зачем оно нужно
Данный программный продукт славится, прежде всего, своей автономностью. Вам понадобится лишь относительно мощный компьютер и побольше места на жёстком диске.
Компании также могут применять GPT4All в своих корпоративных целях, например для облегчения выполнения сотрудниками определённых задач, для чего можно развернуть модель на корпоративном сервере. Вы также можете арендовать VPS или выделенный сервер, и у вас будет нейросеть для друзей, стабильная и практически без ограничений. Возможность тренировки позволяет вам адаптировать сеть под свои запросы, в ближайшее время прогнозируется появление онлайн-сервисов на данной языковой модели.
Напишите в комментарии, хотели бы вы развернуть подобного чат-бота где-либо, будь то на вашем личном компьютере или на сервере?