Присвоение редкости с помощью оценки привлекательности с помощью машинного обучения

Стандартная процедура назначения редкости для NFT заключается в создании таблицы признаков и ручном назначении процентов для появления. Научный язык говорит, что у людей разные вкусы. Выбор самых редких определенных признаков не коррелирует с тем фактом, что сгенерированный NFT также будет восприниматься как симпатичный. Это, а также свобода независимого выбора различных черт на основе назначенных вручную таблиц редкости заставляют нас решать эту проблему с помощью машинного обучения. Наши NFT будут не только иметь сходство, представляющее собой привлекательную комбинацию индивидуальных черт, но также будут иметь соответствующие добавленные черты. Распределение будет рассчитываться из случайно назначенного начального числа для выбора комбинации NFT в рассчитанных ячейках распределения, когда процесс чеканки завершится.

Выражаясь кошачьим языком, ваши золотые часы Rolex драгоценны, но они не всегда будут хорошо сочетаться с вашей любимой толстовкой с капюшоном. Вот почему мы оцениваем эту комбинацию менее привлекательной, чем Casio G-shock с капюшоном Gundam.

Случайное создание NFT и распределение привлекательности

Итак, как мы оцениваем привлекательность? В конце концов, нам нужно будет присвоить NFT какое-то значение, и у всех нас разные вкусы, как говорится, красота в глазах смотрящего. Во-первых, мы трижды создали нашу коллекцию NFT с оценкой на основе машинного обучения (привлекательность) и сравнили результаты. Выбор признаков (количества) был следующим: фон (13), кожа (25), лицо (9), форма тела (71), рот (21), уши (15), голова (29), глаза (24). и кадры, представляющие оценку привлекательности. Следующие слои могут быть пустыми (без добавления визуальных элементов): лицо, уши, телосложение и голова.

Нормальное распределение привлекательности во всех трех наборах оценивалось с использованием теста нормальности Шапиро-Уилка, где сгенерированные наборы 1 и 2 прошли, и мы уверены, что распределение является нормальным, в то время как привлекательность набора 3 не следует нормальному распределению.

Индивидуальный вклад в привлекательность, разделенный на отдельные функции, представленные диаграммами с зазубринами, показан ниже:

Существует единство в самых положительных и отрицательных тенденциях черт для 4 из 7: фон, кожа, лицо и голова во всех трех наборах. Из 199 индивидуальных признаков 113 находятся в пределах значимого эффекта унисона.

Наша NFT состоит из нескольких переменных, влияющих на общую привлекательность в качестве переменной результата. Поэтому, поскольку наши данные состоят из множества факторов в виде категориальных данных с непрерывными переменными симпатии, мы начали исследовать, имеет ли место кластеризация. Кластеризация предполагает, что существует комбинация факторов, имеющих схожие характеристики. Методом выбора для нас был хорошо зарекомендовавший себя кластерный анализ, полученный из метода К-средних, К-прототипов из пакета kmodes. Мы сомневались, что будут какие-либо наблюдаемые кластеры, и мы хотели подтвердить это с помощью алгоритма. Никакой кластеризации мы не наблюдали. Это означает, что вклад комбинации отдельных факторов не имеет какого-либо различимого правила.

Точность оценивания по всему социальному спектру

Мы случайным образом выбрали 10 сгенерированных NFT из нижних 5% и верхних 5% распределения привлекательности. Затем мы позволяем людям сортировать их в соответствии с их личными предпочтениями. Поскольку вкус индивидуален и у нас не было времени проводить обширные анкеты для тысяч людей, мы упростили нашу методику сравнения между группами по точности отнесения НФТ к верхней и нижней половинам. Что на самом деле не удалось, так как у нас был размер выборки, которая даже близко не соответствовала нормальному распределению. Но что мы хотели подтвердить с помощью нашего эксперимента, так это посмотреть, влияют ли поколение и пол на симпатию. Результаты показали, что существует достоверное различие с использованием анализа дисперсии между группами мужчин и женщин миллениалов и поколения Z с 95% уровнем значимости (р-значение = 0,27, N = 40). Более точные результаты были получены при сравнении Привлекательность поколения миллениалов к оценке симпатии машинного обучения. Основное влияние различия между миллениалами и поколением z заключается в том, что модель обучалась на данных из социальных сетей, где мы не учитывали поколение на входе. Для любых алгоритмов симпатии это необходимо учитывать, чтобы обучать модели, используя также точные социально-экономические данные.

Заключение

Основываясь на наших результатах, мы хотели бы, чтобы наши NFT были привлекательными, основанными на индивидуальном вкусе, а не на дефиците/симпатичности. Лучшее изречение, подходящее для нашей коллекции, звучит так: «Мусор одного человека — сокровище другого». Наш подход к привлекательности еще не идеален, и мы хотели бы улучшить его, добавив более точные данные, дополненные возрастными группами и другими демографическими/социально-экономическими факторами. Мы выделим часть нашей казны ETH проекту, чтобы описать и разработать более привлекательную модель машинного обучения, исходный код которой мы будем использовать в других проектах.