Обучение в несколько этапов с использованием модели изучения языка (LLM) Google Vertex AI.

Недавно мы столкнулись с интересной задачей: из предоставленного списка описаний пакетов Android нам нужно было определить, какие из них могут быть связаны с азартными играми и приложениями для быстрого вывода денег. Эта информация будет использоваться как часть разработки функций для анализа мошенничества.

Само собой разумеется, что мошенничество – это всегда бесконечная игра в кошки-мышки между мошенниками и организациями, пытающимися защитить своих клиентов и активы. Чтобы оставаться впереди, мы все чаще используем модели машинного обучения для обнаружения мошеннических действий.

В этой статье я покажу, как нам удалось классифицировать около 4000 описаний пакетов Android примерно за час от начала до конца!

Что бы мы делали до получения степени LLM

До LLM для достижения этой задачи нам необходимо:

  1. Пометьте вручную довольно значительное количество идентификаторов пакетов с соответствующими категориями.
  2. Создайте и обучите классификатор
  3. Промойте и повторите, если результаты неудовлетворительны.

Новый рабочий процесс

В этом новом рабочем процессе нам нужно было написать (минимальный) код только на самом последнем этапе. Всего остального мы смогли достичь в Vertex AI.

1. Доступ к Vertex AI в консоли Google Cloud:

Выберите «Язык» в разделе Generative AI Studio в левом меню, а затем «Текстовая подсказка».

2. Напишите подсказку и укажите категории

Первый шаг — написать подсказку и указать категории. Возможно, для этого потребуется немного поэкспериментировать, но здесь я просто перечислил категории, которые меня интересовали: