Обсуждение:Генератор текста

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Текст от Йеуда бен Бецалель[править код]

Изучение вопроса не даёт доказательств существования скрипта. Текст не удалён, но закомментирован. Prilutsky 02:36, 25 декабря 2008 (UTC)

Ссылки[править код]

Многие ссылки или нерабочие, или ведут на неработающие ресурсы. Поправьте, кто умный? --83.170.234.17 18:34, 14 октября 2010 (UTC)

Пару ссылок удалил. Остальные вроде бы работают. -- X7q 19:04, 14 октября 2010 (UTC)

Новая теория - вынесена из статьи[править код]

Следующий текст вынесен из статьи (неясно соответствие ВП:КЗТ, участник на запрс не отреагировал). Викидим 21:43, 25 марта 2011 (UTC)

Создание генераторов текста
В диссертационной работе "Методы и средства порождения семантических конструкций естественно-языковых интерфейсов программных систем" Д.В. Личаргина http://planetadisser.com/see/dis_5443611.html в 2004 году были предложены некоторые принципы генерации осмысленных фраз и текстов естественного языка на основе векторизации семантических полей естественного языка и построения многомерного пространства семантических понятий, в частности, для английского языка. Осмысленные фразы в данной работе рассматриваются как функции определенного вида над многомерным пространством понятий / точек естественного языка, таким образом решение задачи, сформулированной ведущими семантистами, (Вердиева З. Н. Семантические поля в современном английском языке. – М.: Высшая школа, 1986., Селиверстова О. Н. Контрастивная синтаксическая семантика. – М.: Наука, 1990.) по упорядочению и формальной классификации семантических полей дало возможность в некотором приближении найти формально-математический критерий отличия осмысленных предложений от бессмысленных, и реализует алгоритмы генерации осмысленных фраз на естественном языке. Так, например, фраза "я стираю рубашку" кодируется цепочкой векторов [Сущность, Существо // Презентация, Идея] + [Действие, Предмет, На-Живом] + [Сущность, Предмет, На-Живом] и интерпретируется как осмысленная, а фраза "я стираю книгу" кодируется цепочкой векторов [Сущность, Существо // Презентация, Идея] + [Действие, Предмет, На-Живом] + [Сущность, Предмет // Сущность, Информация] и интерпретируется как бессмысленная. Метод позволяет выделять из многомерной базы данных таблицы, порождающие до 90-99% осмысленных фраз без учета возможностей smart таблиц, запоминающих соответствия внутри семантических групп. Генерацию текстов призваны обеспечить сети подстановочных таблиц по различным темам. Данные теоретические результаты еще не получили достаточного практического развития.

К чему это приведет?[править код]

Здесь находятся завершившиеся обсуждения. Просьба не вносить изменений.

Если допустим все-же как-то удастся сделать качественный генератор текстов, то это приведет к следующим проблемам: 1. Проблема авторства и плагиаторства. Поскольку текст можно построить по определенным правилам, то количество вариантов текста ограничено. Когда появится такая программа, ее безусловно захочет скачать каждый пользователь сети. Если для генерации текста достаточно нажать одну кнопку, то это сможет сделать любой человек, даже маленький ребенок. Далее естественно многие захотят выставить результат работы в интернет. А это миллиарды текстов, ежедневно и среди этих текстов неизбежно будет вероятность повторения текста, который уже существует в сети. Таким образом, установить авторство будет достаточно сложно, если вообще возможно. 2. Сотни тысяч профессиональных копирайтеров потеряют работу. Кто будет покупать текстовый контент, когда с помощью такой программы можно нагенерировать миллионы текстового контента абсолютно бесплатно? И размер здесь будет зависеть не от профессионализма владельца генератора текста, а от мощности его компьютера. 3. Появится слишком много информации, которая будет похоже на правду, и которую можно будет выдавать за правду. Когда на Челябинск упал метеорит первый канал показал видео-контент взятый с youtube (ссылка <удалена>) "Воронка после падения челябинского метеорита". На самом деле изначальное название видео-контента было "Дарваза, газовый кратер в Туркмении." И это уже сейчас, остается только гадать сколько бы подобных новостей появилось если бы людям была доступна технология генерации текстов. 4. Особенно доставляют так называемые СЕО-специалисты, вопрошающие на форумах про "где скачать бесплатный генератор контента", аргументируя тем что статьи, написанные копирайтерами слишком дорогие (см. пункт 2). Появление бесплатного генератора текстов оставило бы без работы самих СЕО специалистов, поскольку на рынок придут более крупные игроки (хотя бы те же самые парни из google) и задавят одиночек и группы сеошников претензиями на плагиаторство, судебными исками, да и просто кластерными системами, которые физически (по генерации текста) вытолкнут халявщиков с рынка. Рекламодателям безусловно будет удобно работать с крупными поставщиками контента. Остальным в лучшем случае достанутся копейки в прямом смысле этого слова. 62.213.57.167 11:12, 21 апреля 2013 (UTC) Смотрящий в будущее