Толока (сервис)
Толока | |
---|---|
Тип | бизнес |
Основание | 2014 |
Основатели | Ольга Мегорская |
Отрасль | интернет |
Сайт | toloka.ai |
Толо́ка (ранее Яндекс Толока) — краудсорсинговый проект, созданный в 2014 году[1] для быстрой разметки большого количества данных, которые затем используются для машинного обучения и совершенствования поисковых алгоритмов[2]. Как правило, размещаемые задания достаточно простые, для их исполнения не требуется специальная подготовка[3]. В основном они связаны с анализом и оценкой контента[4]. Поэтому любой желающий может выполнять задания и получать за них вознаграждение[5].
Названия сервиса
[править | править код]Толо́ка — это форма деревенской взаимопомощи в России, Украине, Белоруссии, Эстонии, Латвии и Литве. Её организовывали в деревне для выполнения срочных работ, требующих большого количества работников: сбор урожая, вырубка леса, сооружение домов и т. д. Иногда толоку использовали для проведения общественных работ (строительство церквей, школ, дорог и т. п.).
Идея совместной полезной работы на общий результат сочетается с принципом краудсорсинга[6].
Виды заданий и область применения результатов
[править | править код]Совершенствование поисковых алгоритмов
[править | править код]Результаты разметки помогают улучшить качество поиска и эффективно настраивать алгоритмы распределения его результатов. Так, в августе 2017-го года Яндекс представил новый поисковый алгоритм «Королёв», при создании которого для обучения нейронных сетей использовались оценки толокеров. За два с лишним года существования сервиса они дали около двух миллиардов оценок, которые позволили разработчикам значительно усовершенствовать свой алгоритм[7].
Развитие машинного обучения
[править | править код]Чтобы машина поняла, как решать ту или иную задачу, необходимо показать ей огромное количество примеров, как положительных, так и отрицательных[8]. Пользователи сервиса Яндекс Толока в числе других задач могут получать и задания по описанию объектов, определённых компьютером на изображении. Например, на фото помечены объекты, которые смог определить искусственный интеллект, но для применения этих данных в деле требуется точно знать, что это за объекты, чтобы обучить искусственный интеллект по массе таких определений человеком. Который, в свою очередь, получит за такую работу вознаграждение.[2] Кроме того, в Толоке производят проверку автоматически полученных черновиков словарных статей для Яндекс Переводчика.[9]
Аудит и маркетинговые исследования
[править | править код]Проверка качества работы интернет-магазина, службы доставки, написание отзывов о продуктах и услугах. Например, в 2017 году пользователи Толоки принимали участие в проверке качества работы сервиса возврата товара на Яндекс Маркете. Подобные эксперименты позволяют контролировать качество работы сервиса и выявлять слабые места, над которыми в дальнейшем будет проведена работа по улучшению и устранению выявленных проблем.[10] В другом проекте пользователям предлагалось написать отзыв на товар из популярных категорий и снабдить его собственными фотографиями[11][12].
Выбор дизайна и названий новых продуктов и сервисов
[править | править код]Ответы на вопросы, связанные с выбором наиболее удачного названия и дизайна для нового продукта или сервиса[13], личными или потребительскими предпочтениями пользователей. В одном из таких опросов толокеры выбирали название для голосового помощника Яндекса[14]. Целью задания было — определить черты характера девушки с тем или иным именем. Для опроса взяли как нужные характеристики так и совсем неподходящие, и стали спрашивать: „Если у девушки вот такое имя, то она скорее добрая или агрессивная?“. С большим отрывом в опросе победило имя «Алиса».[15]
Вознаграждение и вывод средств
[править | править код]Задания в Толоке оплачиваются — сумма, которую можно заработать, указана рядом с заданием[8]. Для вывода средств можно воспользоваться системами: ЮMoney (Бывшие Яндекс Деньги), PayPal, Qiwi. На этапе отладки процессов со стороны Толоки вывод денег может занимать от нескольких минут до месяца[6].
Мобильные приложения
[править | править код]Для решения задач, которые требуют работу «в поле» (например, пойти по адресу и проверить актуальность информации об организации), существует мобильная версия Толоки[6]. Сервисом разработаны два приложения — для Android и iOS.
Пользователи
[править | править код]Пользователи Толоки, или толокeры — люди, которыe за вознаграждeниe выполняют задания по тeстированию и улучшeнию систeмы на краудфандинговой площадкe Яндeкс.Толока[16]. В настоящее время в Толоке около 4 миллионов зарегистрированных пользователей[17] из России, с Украины, из Белоруссии, Казахстана, Узбекистана, Турции, Франции, Индонезии и других стран[18], которые выставили более 2 миллиардов оценок[5]. В 2018 году в проектах в «Толоке» поучаствовало больше миллиона людей[17]. Большинство толокеров — это молодые люди до 35 лет (как правило, студенты технических вузов или мамы в декрете).[6] В основном исполнители рассматривают Толоку в качестве дополнительного источника денег, хотя многие отмечают, что им нравится выполнять полезную работу, делать интернет чище.[6] В 2017 году интернет-холдинг Яндекс наградил 25-лeтнего челябинца Илью Михалeнко за наибольший вклад в совeршeнствованиe поисковой системы.[19] На цeрeмонии запуска нового алгоритма поиска чeлябинцу вручили статуэтку в видe ракeты как символа того, что вводимыe работниками Яндекса инновации сопоставимы с полётами людeй в космос.[1]
Заказчики
[править | править код]Все задания в Толоке размещают Заказчики. Основные направления использования «Толоки» внутри проектов «Яндекса» — это сбор и обработка данных для проектов, связанных с машинным обучением, речевыми технологиями, компьютерным зрением, умными алгоритмами «Поиска» и т. д., модерация контента (разговоры в «Яндекс Картах»), полевые задания (актуализация данных об организациях в «Справочнике»), оптимизация внутренних бизнес-процессов (поиск публикаций в соцсетях, разметка упоминаний Яндекса по тональности на позитивные и негативные). Поскольку над задачей одновременно работают как минимум сотни, а то и тысячи толокеров, результаты готовы в худшем случае на следующий день[2].
Критика
[править | править код]Для выявления и изъятия ЛГБТ-книг интернет-издательство Ridero использовало нейросеть, обучавшуюся с помощью «Толоки», чьим пользователям предлагали прочитать текст и указать, одобряется ли в нем «существование лесбиянок, геев, бисексуалов и трансгендеров», смена пола, зоофилия, некрофилия, идеи чайлдфри или инцест. В пресс-службе «Яндекса» сообщили, что отозвали это задание, сочтя его оскорбительным.[20]
Согласно взлому белорусскими хакерами Главного радиочастотного центра Роскомнадзора в ноябре 2022 г., "Яндекс.Толока" используется Роскомнадзором для обучения нейросетей ищущего "запрещённый контент" "Чистого интернета".[21]
Исследования в Толоке
[править | править код]Толока — это не только инструмент для решения прикладных задач, но и площадка для научных исследований в разных предметных областях. В мае 2019 года команда сервиса начала публиковать наборы данных для некоммерческих, академических целей, чтобы поддержать научное сообщество и привлечь исследователей в Толоку. Датасеты могут быть интересны исследователям разных направлений: для лингвистических исследований, для задач компьютерного зрения, для тестирования моделей агрегации вердиктов исполнителей и обучения чат-ботов[22].
Примечания
[править | править код]- ↑ 1 2 "Яндeкс назвал своим лучшим толокeром житeля Чeлябинска". АН "Доступ". 23-08-2017. Архивировано 6 сентября 2018. Дата обращения: 19 февраля 2018.
{{cite news}}
: Проверьте значение даты:|date=
(справка) - ↑ 1 2 3 Александр Лычавко (15-01-2018). "«Зимой выхлопные газы кажутся лидару стеной». Как в минском офисе «Яндекса» разрабатывают беспилотники". dev.by. Архивировано 18 февраля 2018. Дата обращения: 15 февраля 2018.
{{cite news}}
: Проверьте значение даты:|date=
(справка) - ↑ Дмитрий Шихов (17-01-2018). "Uber в ритейле: как это работает". Rusbase. Архивировано 17 января 2018. Дата обращения: 15 февраля 2018.
{{cite news}}
: Проверьте значение даты:|date=
(справка) - ↑ Алексей Берилло (23-10-2017). "Конференция Nvidia GTC 2017 Europe: первым делом автопилоты". ixbt.com. Архивировано 2 февраля 2018. Дата обращения: 19 февраля 2018.
{{cite news}}
: Проверьте значение даты:|date=
(справка) - ↑ 1 2 Роман Рожков (23-08-2017). "«Яндекс» подключил «Королева» к поискам". Комерстантъ. Архивировано 6 октября 2018. Дата обращения: 19 февраля 2018.
{{cite news}}
: Проверьте значение даты:|date=
(справка) - ↑ 1 2 3 4 5 TolokaTeam (20-07-2016). "Яндекс.Толока. Как люди помогают обучать машинный интеллект". habrahabr. Архивировано 31 марта 2017. Дата обращения: 19 января 2018.
{{cite news}}
: Проверьте значение даты:|date=
(справка) - ↑ Денис Сухов (22-08-2017). "Компания «Яндекс» представила новый поисковый алгоритм «Королев»". Комсомольская Правда. Архивировано 6 октября 2018. Дата обращения: 22 января 2018.
{{cite news}}
: Проверьте значение даты:|date=
(справка) - ↑ 1 2 Иван Кущ (23-08-2017). "Нейросети, космос, человек: «Яндекс» представил новый поиск". Будь мобильным!. Архивировано 26 августа 2017. Дата обращения: 19 февраля 2018.
{{cite news}}
: Проверьте значение даты:|date=
(справка) - ↑ Екатерина Еникеева (30-01-2018 г.). "Как робот-переводчик находит и выучивает новые слова". N + 1. Архивировано 6 октября 2018. Дата обращения: 15 февраля 2018.
{{cite news}}
: Проверьте значение даты:|date=
(справка) - ↑ "«Яндекс» запустил эксперимент «Контрольная закупка на Маркете»". retail.ru. 13-02-2017.
{{cite news}}
: Проверьте значение даты:|date=
(справка) - ↑ "В товарных отзывах на "Маркете" появятся фото". oborot.ru. 05-04-2017. Архивировано 20 сентября 2020. Дата обращения: 19 февраля 2018.
{{cite news}}
: Проверьте значение даты:|date=
(справка) - ↑ "«Яндекс.Маркет» предложил пользователям писать отзывы к товарам за деньги". Афиша daily. 20-02-2017.
{{cite news}}
: Проверьте значение даты:|date=
(справка) - ↑ Саша Море (02-02-2018). "Дизайн продукта от начала до конца". vc.ru.
{{cite news}}
: Проверьте значение даты:|date=
(справка) - ↑ Василий Волнухин (13-02-2018). "Директор Яндекса по технологиям: программисты из России – это уже давно серьезный бренд".
{{cite news}}
: Проверьте значение даты:|date=
(справка) - ↑ Daria Khokhlova (10-10-2017). "Как «Яндекс» создавал «Алису»". vc.ru.
{{cite news}}
: Проверьте значение даты:|date=
(справка) - ↑ "Чем жила Челябинская область: главные новости недели". АН "Доступ". 27-08-2017. Архивировано 6 сентября 2018. Дата обращения: 19 февраля 2018.
{{cite news}}
: Проверьте значение даты:|date=
(справка) - ↑ 1 2 Татьяна Петрущенкова (08-04-2019). "«Мы хотим монетизировать экспертизу в краудсорсинге»". Rusbase. Архивировано 11 апреля 2019. Дата обращения: 11 апреля 2019.
{{cite news}}
: Проверьте значение даты:|date=
(справка) - ↑ Давид Нармания (2017-09-23). "Двадцать лет спустя: как "Яндекс" стал не только поисковиком". РИА новости. Архивировано 9 ноября 2017. Дата обращения: 19 января 2018.
- ↑ "Челябинец стал лучшим тестером Яндекса". ГТРК “Южный Урал”. 23-08-2017. Архивировано 6 сентября 2018. Дата обращения: 19 февраля 2018.
{{cite news}}
: Проверьте значение даты:|date=
(справка) - ↑ "Чернокнижники. Как закон о «пропаганде» ЛГБТ, вступивший в силу неделю назад, уже изменил издательский рынок". Медиазона. 2022-12-12.
- ↑ "Архитектура российской цензуры: что мы узнали из крупнейшей утечки в истории Роскомнадзора. Главное". Русская служба Би-би-си. 2022-02-09. Архивировано 16 мая 2023. Дата обращения: 6 сентября 2024.
- ↑ Яндекс открывает датасеты Толоки для исследователей . habr.com. Дата обращения: 2 июля 2019. Архивировано 2 июля 2019 года.