Тег (метаданные)

Тег, либо тэг (от англ. tag: метка, бирка, ярлык) — ассоциированное ключевое слово, относящееся к какой-либо информации (текст, фото, видео, закладки браузера и другие файлы). Такие метаданные помогают полнее описать эти куски информации и быстро находить их через поисковый запрос. Тэги используются без жёстких правил автором или конечным потребителем.

Тегирование стало популярным благодаря созданным в парадигме Веб 2.0 сайтам и сервисам. Также метатэги стали частью некоторых компьютерных программ и операционных систем.

История[править | править код]

Присвоение меток, или тегирование, было создано в качестве инструмента для помощи в классификации, обозначении принадлежности, указании границ, определении идентичности. Может быть словом, изображением или любой другой идентификационной меткой. Аналогом в реальном мире являются топографические описи и научно-справочные картотеки экспонатов музеев. Идентификация и классификация объектов и информации с помощью слов возникло задолго до появления компьютеров. Однако поисковые запросы значительно ускоряют исследование записей.

Сетевые и интернет-базы данных, а также ранние интернет-сайты применяют метки при опубликовании данных для помощи при поиске контента конечными пользователями. Со времён веб 1.0 пользователи приняли понятие тег как любое буквенное или словесное описание, и более не уточняют его.

В 2003 году веб-сайт социальных закладок Delicious предложил своим пользователям добавлять теги к своим закладкам, чтобы ускорить последующий их поиск. Также появилась возможность видеть в одном месте всю информацию, связанную с конкретным тегом. Flickr предложил пользователям добавлять собственные текстовые метки каждой своей фотографии создавая гибкую и простую систему метаданных для ускорения поиска изображения. Успешное развитие Flickr и влияние Delicious сделали идею широко известной, и прочие социальные сети и софт — YouTube, Technorati, Last.fm — поддержали её. Остальные компьютерные и интернет-приложения также внедрили идею в виде «меток» в Gmail или возможности добавления и редактирования тегов в iTunes или Winamp.

В ранних версиях сайтов теги использовались дизайнерами для информирования поисковых машин о содержании страниц. Сегодня для этих целей используют мета теги.

Теги-ключевые слова впервые начали использовать в созданной Jumper Networks в сентябре 2008 года платформе Jumper 2.0. Она была первой совместной поисковой системой использующей метод расширенного тегирования в управлении знаниями.

Веб-сайты, использующие теги, часто показывают подборки популярных меток в облаках тегов. Пользовательские теги одинаково полезны как для самих пользователей, так и для остальных посетителей сайта.

Теги могут иметь «восходящий» тип классификации, в отличие от «нисходящего» иерархического. В традиционных иерархических системах, основанных на таксономии, существует ограниченное количество терминов, используемых для корректной идентификации каждого объекта. Тегирование позволяет иметь неограниченное количество меток для классификации. Вместо принадлежности к одной категории объект может иметь несколько различных тегов. Некоторые исследователи экспериментируют, комбинируя иерархическую структуру и «плоские» теги при поиске информации^[1].

Примеры[править | править код]

Многие блог-платформы позволяют авторам отмечать в свободной форме свои публикации наряду с присвоением категории (или взамен этого). Например, статья может быть отмечена тегом «хоккей» и «билеты». Каждый из этих тегов становится гиперссылкой, ведущей к списку всех статей с такой меткой. У блога может быть боковая панель со списком всех тегов этого сайта, каждый элемент которого ведёт к соответствующей подборке. Для ревизии меток автор может редактировать список тегов. Все связи между статьями и списками автоматически обновляются движком блога, благодаря чему отпадает необходимость в ручном перемещении статьи из категории в категорию.

Тегами принято ассоциировать для участников события и конференции для использования в публикациях, например в блогах, фотоотчётах и презентациях. Поисковые движки могут индексировать их для подборок соответствующей тематики при выдаче результатов.

Исследователи могут работать с большим количеством объектов (цитаты, библиографии, изображения) в цифровом виде. При необходимости их можно привязать к нужным меткам или группам меток.

Особые типы тегов[править | править код]

Тройные теги[править | править код]

Специальные тройные теги или машинные теги используют определённый синтаксис для указания дополнительной семантической информации о тегах, делая их понятнее или более информативными для обработки компьютерными программами. Такие теги состоят из трёх частей — пространства имён, предиката и значения. Например, «geo:long=50.123456» является меткой географической долготы с координатой 50,123456. Эта тройная конструкция соответствует модели данных Resource Description Framework.

Тройные теги были придуманы для geolicious^[2] в ноябре 2004 г., чтобы показывать на карте закладки Delicious. Позже они стали применяться после переработки Mappr и GeoBloggers^[3] для фотографий в Flickr.

Специализированные метаданные для географической идентификации теперь известны как геотеггинг. Машинные теги также используют для других нужд, например для идентификации фотографий определённых событий или для обозначения видов биологической номенклатуры.

Хештеги[править | править код]

Хештеги это тип метаданных, запись которых начинается знаком # (хеш). Этот вид тегов распространён в микроблогинге и социальных сетях — Twitter, Facebook, Google+, ВКонтакте и Instagram. Главное отличие от обычных тэгов — они являются частью самого контента, а не его описания.

Теги знаний[править | править код]

Теги знаний представляют собой тип метаинформации, описывающей или определяющей некоторые аспекты информационных ресурсов (таких как документы, цифровые изображения, таблицы баз знаний или веб-страницы). Теги знаний несколько шире описывают объекты, нежели традиционные неиерархические ключевые слова. Это тип метаданных, представляющих знания в виде специальных форм-профилей, содержащих описание, категорию, класс, семантику, комментарии, заметки, примечания, гиперссылки или справки. Такие профили инвентаризируют информацию, находящуюся на стороннем, часто гетерогенном, ресурсе-хранилище. Теги знаний являются инструментами управления знаниями методами Enterprise 2.0 для записи сведений об инсайтах, опыте, свойствах, зависимостях или взаимоотношениях, ассоциированных с информационными данными. В целом теги более гибки, чем прочие системы классификации управления знаниями.

Инвентаризация знаний тегами подразумевает много разных форм, например: фактические знания (находят в книгах и данных), концептуальные знания (находят в перспективах и концептах), оценочные знания (требующих суждений и предположений), методологические знания (полученных из рассуждений и стратегий).^[4] Такие формы знаний часто выходят за рамки данных и основаны на личном опыте, озарениях или оценке. Знания это информация в голове индивидуума — персональное субъективное понимание фактов, операций, концептов, объяснений, идей, обзоров и суждений, могущих быть или не быть уникальными, полезными, верными или структурированными. Теги знаний расширяют границы информации и добавляют новые значения, контексты, объяснения.^[5] Knowledge tags are valuable for preserving organizational intelligence that is often lost due to turn-over, for sharing knowledge stored in the minds of individuals that is typically isolated and unharnessed by the organization, and for connecting knowledge that is often lost or disconnected from an information resource.^[6]

Преимущества и недостатки[править | править код]

В типичной системе тегирования нет фиксированной информации о значениях или семантике каждого тега; пользователи могут легко использовать новые теги наряду со старыми. Имея корни в культуре или времени создания, иерархическая система довольно сложно или медленно поддаётся изменению.^[7] Гибкость тегирования позволяет пользователям классифицировать свои коллекции самыми удобными, на их взгляд, способами, но разнообразие персональных представлений создаёт проблемы в процессах поиска и исследования.

Когда пользователям дана возможность свободного выбора тегов (фолксономия вместо выбора терминов из контролируемых словарей), в метаданных появляются омонимы (одинаковые теги с разным значением) и синонимы (множество тегов с одним значением), которые могут вести к неуместным связям между объектами и безрезультатному поиску информации об объекте.^[8] Например, тег «замок» может привести к постройке или механизму, а объекты, относящиеся к версии ядра Linux, будут отмечены «Linux», «ядро», «Penguin», либо другими словами. Пользователи могут вводить теги видоизменёнными словами, например в единственном или множественном числе^[9], тем самым усложняя навигацию в системах, где нет стемминга. Крупномасштабные проблемы фолксономии вынуждают пользователей заботиться об однообразном понимании терминов своей системы путём принятия частичных соглашений и таким образом упрощать доступ к информации. Ещё один недостаток — некоторое замедление работы процессора из-за того, что установление соответствия типа команды типу данных, в обычных ЭВМ выполняемое на этапе компиляции, при использовании тегов переносится на этап выполнения программы.^[10]

Спам[править | править код]

Доступные для пользования системы тегирования подвержены захламлению. В надежде привлечь посетителей (например, как в YouTube) люди отмечают информацию чрезмерным количеством тегов или тегами, не имеющим ничего общего с предметом информации. С этим явлением борются путём проверки человеком или статистическими методами идентификации спама.^[11] Ещё одним способом является ограничение на количество тегов.

Синтаксис[править | править код]

Некоторые системы с тегами имеют одно текстовое поле для ввода слов, поэтому для лексического анализа их нужно разделять. Наиболее популярными разделителями стали пробел и запятая. Чтобы можно было пользоваться этими символами, система должна поддерживать высокоуровневые разделители, например кавычки или экранирование символов. Часть систем вообще избегает разделителей, позволяя вводить лишь одно слово, тем самым увеличивая время на ввод множества тегов.

Совместимость синтаксиса с HTML достигается путём использования rel-тегов микроформата, имеющих семантическую связь со значением «tag» (rel="tag"), означающую, что указанные по ссылке страницы являются тегами для конкретной части информации.^[12]

См. также[править | править код]

Прочее

Примечания[править | править код]

↑ Tag Hierarchies Архивная копия от 25 июня 2016 на Wayback Machine, research notes by Paul Heymann.
↑ Maron, Mikel geo.lici.us: geotagging hosted services (неопр.) (5 ноября 2004). Дата обращения: 22 мая 2016. Архивировано 28 апреля 2007 года.
↑ Advanced Tagging and TripleTags by Reverend Dan Catt, Geobloggers, January 11, 2006.
↑ Wiig, K. M. (1997), "Knowledge Management: An Introduction and Perspective", Journal of Knowledge Management, 1 (1): 6—14, doi:10.1108/13673279710800682
↑ Cambria, Erik and Hussain, Amir (2012), "Sentic album: Content-, concept-, and context-based online personal photo management system", Cognitive Computation, 4 (4): 477—496, doi:10.1007/s12559-012-9145-4{{citation}}: Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)
↑ Alavi, Maryam; Leidner (1999), "Knowledge Management Systems: Issues, Challenges, and Benefits" (PDF), Communications of the Association for Information Systems, 1 (7) Архивная копия от 25 декабря 2010 на Wayback Machine
↑ Smith, Gene (2008). Tagging: People-Powered Metadata for the Social Web. Berkeley, CA: New Riders. ISBN 0-321-52917-0
↑ Golder, Scott A. Huberman, Bernardo A. (2005). «The Structure of Collaborative Tagging Systems Архивная копия от 1 ноября 2014 на Wayback Machine». Information Dynamics Lab, HP Labs. Visited November 24, 2005.
↑ Singular vs. plural tags in a tag-based categorization system Архивировано 24 мая 2007 года. by Keith Devens, December 24, 2004.
↑ Теги и дескрипторы. Самоопределяемые данные. (неопр.) Архивировано 31 марта 2022 года.
↑ Tag Spam Архивная копия от 6 августа 2016 на Wayback Machine, research notes by Paul Heymann.
↑ rel tag microformat specification Архивная копия от 20 января 2010 на Wayback Machine, Microformats Wiki, January 10, 2005.

Основное

Nonaka, Ikujiro (1994), "A dynamic theory of organizational knowledge creation", Organization Science, 5 (1): 14—37, doi:10.1287/orsc.5.1.14
Wigg, Karl M (1993), "Knowledge Management Foundations: Thinking About Thinking: How People and Organizations Create, Represent and Use Knowledge", Arlington: Schema Press: 153
Alavi, Maryam; Leidner, Dorothy E. (1999), "Knowledge management systems: issues, challenges, and benefits", Communications of the AIS, 1 (2)
Kemsley, Sandy (2009), "Models, Social Tagging and Knowledge Management #BPM2009 #BPMS2'09", BPM, Enterprise 2.0 and technology trends in business

Ссылки[править | править код]

Hashtag Techniques for Businesses, Curt Finch. Inc Magazine. May 26, 2011.
A Uniform Resource Name (URN) Namespace for Tag Metadata. Tim Bray. Internet draft, expired August 5, 2007.

[1] Tag Hierarchies Архивная копия от 25 июня 2016 на Wayback Machine, research notes by Paul Heymann.

[2] Maron, Mikel geo.lici.us: geotagging hosted services (неопр.) (5 ноября 2004). Дата обращения: 22 мая 2016. Архивировано 28 апреля 2007 года.

[3] Advanced Tagging and TripleTags by Reverend Dan Catt, Geobloggers, January 11, 2006.

[4] Wiig, K. M. (1997), "Knowledge Management: An Introduction and Perspective", Journal of Knowledge Management, 1 (1): 6—14, doi:10.1108/13673279710800682

[5] Cambria, Erik and Hussain, Amir (2012), "Sentic album: Content-, concept-, and context-based online personal photo management system", Cognitive Computation, 4 (4): 477—496, doi:10.1007/s12559-012-9145-4{{citation}}: Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)

[6] Alavi, Maryam; Leidner (1999), "Knowledge Management Systems: Issues, Challenges, and Benefits" (PDF), Communications of the Association for Information Systems, 1 (7) Архивная копия от 25 декабря 2010 на Wayback Machine

[Smith2008-7] Smith, Gene (2008). Tagging: People-Powered Metadata for the Social Web. Berkeley, CA: New Riders. ISBN 0-321-52917-0

[8] Golder, Scott A. Huberman, Bernardo A. (2005). «The Structure of Collaborative Tagging Systems Архивная копия от 1 ноября 2014 на Wayback Machine». Information Dynamics Lab, HP Labs. Visited November 24, 2005.

[9] Singular vs. plural tags in a tag-based categorization system Архивировано 24 мая 2007 года. by Keith Devens, December 24, 2004.

[10] Теги и дескрипторы. Самоопределяемые данные. (неопр.) Архивировано 31 марта 2022 года.

[11] Tag Spam Архивная копия от 6 августа 2016 на Wayback Machine, research notes by Paul Heymann.

[12] rel tag microformat specification Архивная копия от 20 января 2010 на Wayback Machine, Microformats Wiki, January 10, 2005.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]