Толока (сервис)

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
Толока
Изображение логотипа
Тип бизнес
Основание 2014
Основатели Ольга Мегорская
Отрасль интернет
Сайт toloka.ai

Толо́ка (ранее Яндекс Толока) — краудсорсинговый проект, созданный в 2014 году[1] для быстрой разметки большого количества данных, которые затем используются для машинного обучения и совершенствования поисковых алгоритмов[2]. Как правило, размещаемые задания достаточно простые, для их исполнения не требуется специальная подготовка[3]. В основном они связаны с анализом и оценкой контента[4]. Поэтому любой желающий может выполнять задания и получать за них вознаграждение[5].

Названия сервиса

[править | править код]

Толо́ка — это форма деревенской взаимопомощи в России, Украине, Белоруссии, Эстонии, Латвии и Литве. Её организовывали в деревне для выполнения срочных работ, требующих большого количества работников: сбор урожая, вырубка леса, сооружение домов и т. д. Иногда толоку использовали для проведения общественных работ (строительство церквей, школ, дорог и т. п.).

Идея совместной полезной работы на общий результат сочетается с принципом краудсорсинга[6].

Виды заданий и область применения результатов

[править | править код]

Совершенствование поисковых алгоритмов

[править | править код]

Результаты разметки помогают улучшить качество поиска и эффективно настраивать алгоритмы распределения его результатов. Так, в августе 2017-го года Яндекс представил новый поисковый алгоритм «Королёв», при создании которого для обучения нейронных сетей использовались оценки толокеров. За два с лишним года существования сервиса они дали около двух миллиардов оценок, которые позволили разработчикам значительно усовершенствовать свой алгоритм[7].

Развитие машинного обучения

[править | править код]

Чтобы машина поняла, как решать ту или иную задачу, необходимо показать ей огромное количество примеров, как положительных, так и отрицательных[8]. Пользователи сервиса Яндекс Толока в числе других задач могут получать и задания по описанию объектов, определённых компьютером на изображении. Например, на фото помечены объекты, которые смог определить искусственный интеллект, но для применения этих данных в деле требуется точно знать, что это за объекты, чтобы обучить искусственный интеллект по массе таких определений человеком. Который, в свою очередь, получит за такую работу вознаграждение.[2] Кроме того, в Толоке производят проверку автоматически полученных черновиков словарных статей для Яндекс Переводчика.[9]

Аудит и маркетинговые исследования

[править | править код]

Проверка качества работы интернет-магазина, службы доставки, написание отзывов о продуктах и услугах. Например, в 2017 году пользователи Толоки принимали участие в проверке качества работы сервиса возврата товара на Яндекс Маркете. Подобные эксперименты позволяют контролировать качество работы сервиса и выявлять слабые места, над которыми в дальнейшем будет проведена работа по улучшению и устранению выявленных проблем.[10] В другом проекте пользователям предлагалось написать отзыв на товар из популярных категорий и снабдить его собственными фотографиями[11][12].

Выбор дизайна и названий новых продуктов и сервисов

[править | править код]

Ответы на вопросы, связанные с выбором наиболее удачного названия и дизайна для нового продукта или сервиса[13], личными или потребительскими предпочтениями пользователей. В одном из таких опросов толокеры выбирали название для голосового помощника Яндекса[14]. Целью задания было — определить черты характера девушки с тем или иным именем. Для опроса взяли как нужные характеристики так и совсем неподходящие, и стали спрашивать: „Если у девушки вот такое имя, то она скорее добрая или агрессивная?“. С большим отрывом в опросе победило имя «Алиса».[15]

Вознаграждение и вывод средств

[править | править код]

Задания в Толоке оплачиваются — сумма, которую можно заработать, указана рядом с заданием[8]. Для вывода средств можно воспользоваться системами: ЮMoney (Бывшие Яндекс Деньги), PayPal, Qiwi. На этапе отладки процессов со стороны Толоки вывод денег может занимать от нескольких минут до месяца[6].

Мобильные приложения

[править | править код]

Для решения задач, которые требуют работу «в поле» (например, пойти по адресу и проверить актуальность информации об организации), существует мобильная версия Толоки[6]. Сервисом разработаны два приложения — для Android и iOS.

Пользователи

[править | править код]

Пользователи Толоки, или толокeры — люди, которыe за вознаграждeниe выполняют задания по тeстированию и улучшeнию систeмы на краудфандинговой площадкe Яндeкс.Толока[16]. В настоящее время в Толоке около 4 миллионов зарегистрированных пользователей[17] из России, с Украины, из Белоруссии, Казахстана, Узбекистана, Турции, Франции, Индонезии и других стран[18], которые выставили более 2 миллиардов оценок[5]. В 2018 году в проектах в «Толоке» поучаствовало больше миллиона людей[17]. Большинство толокеров — это молодые люди до 35 лет (как правило, студенты технических вузов или мамы в декрете).[6] В основном исполнители рассматривают Толоку в качестве дополнительного источника денег, хотя многие отмечают, что им нравится выполнять полезную работу, делать интернет чище.[6] В 2017 году интернет-холдинг Яндекс наградил 25-лeтнего челябинца Илью Михалeнко за наибольший вклад в совeршeнствованиe поисковой системы.[19] На цeрeмонии запуска нового алгоритма поиска чeлябинцу вручили статуэтку в видe ракeты как символа того, что вводимыe работниками Яндекса инновации сопоставимы с полётами людeй в космос.[1]

Все задания в Толоке размещают Заказчики. Основные направления использования «Толоки» внутри проектов «Яндекса» — это сбор и обработка данных для проектов, связанных с машинным обучением, речевыми технологиями, компьютерным зрением, умными алгоритмами «Поиска» и т. д., модерация контента (разговоры в «Яндекс Картах»), полевые задания (актуализация данных об организациях в «Справочнике»), оптимизация внутренних бизнес-процессов (поиск публикаций в соцсетях, разметка упоминаний Яндекса по тональности на позитивные и негативные). Поскольку над задачей одновременно работают как минимум сотни, а то и тысячи толокеров, результаты готовы в худшем случае на следующий день[2].

Для выявления и изъятия ЛГБТ-книг интернет-издательство Ridero использовало нейросеть, обучавшуюся с помощью «Толоки», чьим пользователям предлагали прочитать текст и указать, одобряется ли в нем «существование лесбиянок, геев, бисексуалов и трансгендеров», смена пола, зоофилия, некрофилия, идеи чайлдфри или инцест. В пресс-службе «Яндекса» сообщили, что отозвали это задание, сочтя его оскорбительным.[20]

Согласно взлому белорусскими хакерами Главного радиочастотного центра Роскомнадзора в ноябре 2022 г., "Яндекс.Толока" используется Роскомнадзором для обучения нейросетей ищущего "запрещённый контент" "Чистого интернета".[21]

Исследования в Толоке

[править | править код]

Толока — это не только инструмент для решения прикладных задач, но и площадка для научных исследований в разных предметных областях. В мае 2019 года команда сервиса начала публиковать наборы данных для некоммерческих, академических целей, чтобы поддержать научное сообщество и привлечь исследователей в Толоку. Датасеты могут быть интересны исследователям разных направлений: для лингвистических исследований, для задач компьютерного зрения, для тестирования моделей агрегации вердиктов исполнителей и обучения чат-ботов[22].

Примечания

[править | править код]
  1. 1 2 "Яндeкс назвал своим лучшим толокeром житeля Чeлябинска". АН "Доступ". 23-08-2017. Архивировано 6 сентября 2018. Дата обращения: 19 февраля 2018. {{cite news}}: Проверьте значение даты: |date= (справка)
  2. 1 2 3 Александр Лычавко (15-01-2018). "«Зимой выхлопные газы кажутся лидару стеной». Как в минском офисе «Яндекса» разрабатывают беспилотники". dev.by. Архивировано 18 февраля 2018. Дата обращения: 15 февраля 2018. {{cite news}}: Проверьте значение даты: |date= (справка)
  3. Дмитрий Шихов (17-01-2018). "Uber в ритейле: как это работает". Rusbase. Архивировано 17 января 2018. Дата обращения: 15 февраля 2018. {{cite news}}: Проверьте значение даты: |date= (справка)
  4. Алексей Берилло (23-10-2017). "Конференция Nvidia GTC 2017 Europe: первым делом автопилоты". ixbt.com. Архивировано 2 февраля 2018. Дата обращения: 19 февраля 2018. {{cite news}}: Проверьте значение даты: |date= (справка)
  5. 1 2 Роман Рожков (23-08-2017). "«Яндекс» подключил «Королева» к поискам". Комерстантъ. Архивировано 6 октября 2018. Дата обращения: 19 февраля 2018. {{cite news}}: Проверьте значение даты: |date= (справка)
  6. 1 2 3 4 5 TolokaTeam (20-07-2016). "Яндекс.Толока. Как люди помогают обучать машинный интеллект". habrahabr. Архивировано 31 марта 2017. Дата обращения: 19 января 2018. {{cite news}}: Проверьте значение даты: |date= (справка)
  7. Денис Сухов (22-08-2017). "Компания «Яндекс» представила новый поисковый алгоритм «Королев»". Комсомольская Правда. Архивировано 6 октября 2018. Дата обращения: 22 января 2018. {{cite news}}: Проверьте значение даты: |date= (справка)
  8. 1 2 Иван Кущ (23-08-2017). "Нейросети, космос, человек: «Яндекс» представил новый поиск". Будь мобильным!. Архивировано 26 августа 2017. Дата обращения: 19 февраля 2018. {{cite news}}: Проверьте значение даты: |date= (справка)
  9. Екатерина Еникеева (30-01-2018 г.). "Как робот-переводчик находит и выучивает новые слова". N + 1. Архивировано 6 октября 2018. Дата обращения: 15 февраля 2018. {{cite news}}: Проверьте значение даты: |date= (справка)
  10. "«Яндекс» запустил эксперимент «Контрольная закупка на Маркете»". retail.ru. 13-02-2017. {{cite news}}: Проверьте значение даты: |date= (справка)
  11. "В товарных отзывах на "Маркете" появятся фото". oborot.ru. 05-04-2017. Архивировано 20 сентября 2020. Дата обращения: 19 февраля 2018. {{cite news}}: Проверьте значение даты: |date= (справка)
  12. "«Яндекс.Маркет» предложил пользователям писать отзывы к товарам за деньги". Афиша daily. 20-02-2017. {{cite news}}: Проверьте значение даты: |date= (справка)
  13. Саша Море (02-02-2018). "Дизайн продукта от начала до конца". vc.ru. {{cite news}}: Проверьте значение даты: |date= (справка)
  14. Василий Волнухин (13-02-2018). "Директор Яндекса по технологиям: программисты из России – это уже давно серьезный бренд". {{cite news}}: Проверьте значение даты: |date= (справка)
  15. Daria Khokhlova (10-10-2017). "Как «Яндекс» создавал «Алису»". vc.ru. {{cite news}}: Проверьте значение даты: |date= (справка)
  16. "Чем жила Челябинская область: главные новости недели". АН "Доступ". 27-08-2017. Архивировано 6 сентября 2018. Дата обращения: 19 февраля 2018. {{cite news}}: Проверьте значение даты: |date= (справка)
  17. 1 2 Татьяна Петрущенкова (08-04-2019). "«Мы хотим монетизировать экспертизу в краудсорсинге»". Rusbase. Архивировано 11 апреля 2019. Дата обращения: 11 апреля 2019. {{cite news}}: Проверьте значение даты: |date= (справка)
  18. Давид Нармания (2017-09-23). "Двадцать лет спустя: как "Яндекс" стал не только поисковиком". РИА новости. Архивировано 9 ноября 2017. Дата обращения: 19 января 2018.
  19. "Челябинец стал лучшим тестером Яндекса". ГТРК “Южный Урал”. 23-08-2017. Архивировано 6 сентября 2018. Дата обращения: 19 февраля 2018. {{cite news}}: Проверьте значение даты: |date= (справка)
  20. "Чернокнижники. Как закон о «пропаганде» ЛГБТ, вступивший в силу неделю назад, уже изменил издательский рынок". Медиазона. 2022-12-12.
  21. "Архитектура российской цензуры: что мы узнали из крупнейшей утечки в истории Роскомнадзора. Главное". Русская служба Би-би-си. 2022-02-09. Архивировано 16 мая 2023. Дата обращения: 6 сентября 2024.
  22. Яндекс открывает датасеты Толоки для исследователей. habr.com. Дата обращения: 2 июля 2019. Архивировано 2 июля 2019 года.