Обсуждение:Суффиксный автомат
Эта статья входит в число избранных статей русской Википедии. См. страницу номинации. Избрана 21 июня 2020 года. |
Эта статья была признана хорошей статьёй русской Википедии. См. страницу номинации (статус присвоен 16 мая 2020 года). Позднее получила статус избранной. |
Проект «Математика» (уровень ИС, важность для проекта средняя)
Эта статья тематически связана с вики-проектом «Математика», цель которого — создание и улучшение статей по темам, связанным с математикой. Вы можете её отредактировать, а также присоединиться к проекту, принять участие в его обсуждении и поработать над требуемыми статьями. |
24—27 октября 2019 года сведения из статьи «Суффиксный автомат» появлялись на заглавной странице в колонке «Знаете ли вы». В колонке был представлен текст: «Суффиксные деревья родственны суффиксным автоматам». С полным выпуском колонки можно ознакомиться в архиве рубрики «Знаете ли вы». |
Рецензирование статьи Суффиксный автомат
[править код]Начал писать летом, да немного заглохло. В общем, планирую рано или поздно довести до ИС, так что выставляю на рецензирование. Думаю, ещё буду понемногу расширять, но основная работа уже сделана и обратная связь была бы полезной. Буду благодарен любым замечаниям и предложениям. adamant.pwn — contrib/talk 18:00, 15 декабря 2019 (UTC)
- Комментарий: был впервые описан Блумером и — принято перед фамилией персонажа в тексте ставить имя или инициалы. Это всей статьи касается.— Зануда 10:55, 11 февраля 2020 (UTC)
- Здесь ведь имеется в виду только первое вхождение фамилии? Или при каждом упоминании? adamant.pwn — contrib/talk 21:06, 11 февраля 2020 (UTC)
- Думаю, при каждом упоминании. Как-то невежливо людей только по фамилии называть. Зануда 05:57, 12 февраля 2020 (UTC)
- Это несколько странное утверждение. Я сейчас прошёлся по нескольким биографическим статьям и в каждой обнаружил, что с какого-то момента предмет статьи называют просто по фамилии. У вас есть примеры статей, где этого не происходит и, желательно, какое-нибудь правило, которое это регулирует? adamant.pwn — contrib/talk 06:10, 12 февраля 2020 (UTC)
- Ну, я же не пишу, что это правило. Это мое мнение. Потому так и написал "думаю", а не "нужно" или "по правилам".
Зануда 08:08, 12 февраля 2020 (UTC)
- Ну, я же не пишу, что это правило. Это мое мнение. Потому так и написал "думаю", а не "нужно" или "по правилам".
- Это несколько странное утверждение. Я сейчас прошёлся по нескольким биографическим статьям и в каждой обнаружил, что с какого-то момента предмет статьи называют просто по фамилии. У вас есть примеры статей, где этого не происходит и, желательно, какое-нибудь правило, которое это регулирует? adamant.pwn — contrib/talk 06:10, 12 февраля 2020 (UTC)
- Думаю, при каждом упоминании. Как-то невежливо людей только по фамилии называть. Зануда 05:57, 12 февраля 2020 (UTC)
- Здесь ведь имеется в виду только первое вхождение фамилии? Или при каждом упоминании? adamant.pwn — contrib/talk 21:06, 11 февраля 2020 (UTC)
- Комментарий: Блумер и др., В 2001 г. Иненага и др. — в тексте смотрится ужасно. Вы уверены, что нужно сокращать? — Зануда 10:55, 11 февраля 2020 (UTC)
- Это перевод традиционного в науке «Blumer et al», «Inenaga et al» и т.д. Я думаю, что в этом контексте можно перевести как «Блумер с соавторами показали, что...» (чтоб постоянно «другие» не повторялись), если там что-то значительное то «Коллектив исследователей во главе с Иненагой разработал...» [конечно, в том случае если есть некоторые основания полагать, что он действительно руководитель, а не просто первый по алфавиту]. В крайнем случае, можно просто перечислить авторов. Swarrel (обс.) 21:14, 22 марта 2020 (UTC)
- Комментарий: Сноски нужно изменить. Параметр, вызывающий источник, (фамилии авторов) должен быть написан, как в источнике, на языке источника. Аналогично и параметр "пояснение"/"loc". — Зануда 10:55, 11 февраля 2020 (UTC)
В целом замечания лишь по оформлению. Текст вопросов не вызывает.— Зануда 10:55, 11 февраля 2020 (UTC)
- Вроде бы всё поправил, спасибо. adamant.pwn — contrib/talk 21:27, 11 февраля 2020 (UTC)
- Я думаю, что можно закрывать рецензию и выставлять КХС/КИС. Рецензирование само-по себе мало активно, наверное вы это поняли. Номинируйте, на номинации вам отрецензируют. Я обычно (если планирую ещё расширять но не сейчас) номинирую на КХС. Там статью шлифую по ЦУ/ЦС коллег, а потом можно и до ИС доводить. Зануда 08:16, 12 февраля 2020 (UTC)
Итог
[править код]Закрываю рецензию и номинирую (пока) на статус ХС. Большое спасибо всем отметившимся! adamant.pwn — contrib/talk 16:26, 6 апреля 2020 (UTC)
DAWG в преамбуле
[править код]@Derise: термин «directed acyclic word graph», как и DAWG, CDAWG, SDAWG, etc в подавляющем большинстве случаев относится именно к суффиксному автомату, а не к DAFSA. Более того, в англоязычных академических источниках это, по всей видимости, даже более распространённое название, чем, собственно, «suffix automaton» (не мудрено, его Blumer и др. именно как DAWG назвали в своей исходной работе), поэтому я считаю очень важным его указать. Я не против уточнить про DAFSA, но тогда хотелось бы:
- Перевод DAFSA на русский. Детерминированный ациклический конечный автомат?
- Источники на то, что по отношению к DAFSA применяют термин directed acyclic word graph. Хотя на enwiki это утверждается, я не смог найти подтверждения в АИ. Если их нет, то я бы вписал термин без разрешения неоднозначности.
adamant.pwn — contrib/talk 22:18, 16 сентября 2020 (UTC)
- @adamant.pwn: перевод такой, да. Изначально предлагалось убрать вообще все переводы из статьи, потому что «суффиксный автомат» — вполне самостоятельная единица, не требующая никаких уточнений для пользователя русскоязычной Википедии. «Suffix automaton» является буквальным переводом и в русскоязычной статье не обязателен, а DAWG, скорее всего, будет только путать читателей. Впрочем, настаивать по этой части не буду. По поводу разночтений. DAWG является синонимом DAFSA в прикладных задачах, связанных с работой со словарями. Для примера можно посмотреть эту статью. Кроме того, ряд библиотек, работающих со словарями с использованием DAFSA, называются соответствующим образом. Derise (обс.) 01:46, 17 сентября 2020 (UTC)
- Добавил уточнения по наиболее ранним источникам, которые я смог найти и которые в явном виде указывают на это несоответствие. adamant.pwn — contrib/talk 16:10, 18 сентября 2020 (UTC)
Расплывчатость термина «СуФфиксный автомат»
[править код]Из преамбулы — «обработчик подстроки»; из определения формальной лингвистики — «суффикс» конец строки, «префикс» — начало строки, поэтому сразу не совсем ясно, может ли этот автомат обрабатывать произвольную подсроку, это надо бы указать в преамбуле, и полезно определение суффикса, префикса, подстроки внести в раздел «Обозначения». Также в начале неплохо было бы привести пример обработки конкретной строки. Д.Ильин (обс.) 19:03, 17 сентября 2020 (UTC).
- @Д.Ильин: Но ведь в разделе «обозначения» есть определения суффикса, префикса и подстроки… А ещё в преамбуле нет слова «обработчик», так что я вообще не вполне понимаю ваш вопрос. Суффиксный автомат позволяет обрабатывать некоторую информацию про подстроки — например, число различных подстрок, число вхождений некоторой конкретной подстроки в строку, etc. adamant.pwn — contrib/talk 16:09, 18 сентября 2020 (UTC)