Домены и анализ текстов

В настоящее время трудно представить себе жизнь без доступа к интернету. Всемирная паутина пронзила почти все сферы жизни: нужно узнать новости - лезешь в сеть; захотел посмотреть фильм или послушать музыку - заходишь в интернет; нужно что-то купить и снова идешь в интернет и т.д. Интернет стал неотъемлемой частью жизни современного человека.

Для того чтобы все это стало реальностью были созданы миллионы сайтов и поисковые системы по ним. При этом, каждый сайт имеет свое уникальное имя в сети (домен), в одной только зоне .COM насчитывается более 100 млн делегированных доменных имен, а зарегистрированных имен и того больше. К счастью интернет не ограничен только этой зоной и существует огромное число других: .NET, .RU, .ORG, .BIZ,. SITE, .ONLINE, .SHOP, .РФ  и т.д. В которых зарегистрировано значительно меньше доменных имен. С полным список доменных зон (более 1000) можно ознакомится в базе данных IANA.

На даже при таком разнообразии доменных  зон выбрать красивое имя остается достаточно сложной задачей. Во-первых, базовая стоимость регистрации домена в разных зонах разная и она может варьироваться от нескольких сотен рублей до сотен тысяч. Во-вторых, красивые имена в популярных зонах скорее всего заняты, регистрируются по завышенным ценам (премиальные домены) или перепродаются  на различных торговых площадках таких как Sedo или GoDaddy. Так домен SEX.COM был продан за 13 млн $ в 2010 году, HOTELS.COM за 11 млн в 2001, WINE.COM за 3 млн  в 1999. Этот список можно продолжать еще долго.

Доменное имя стало ценным ресурсом как для простого человека (семейный сайт, визитка), для предпринимателя (интернет магазин)  и для компании. Найти сразу понравившиеся имя и чтобы оно оказалось свободным стало не так просто.

Для того чтобы облегчить процесс подбора и предложения доменных имен, а также привлечь клиентов регистраторы доменов разрабатывают сервисы проверки, подбора, рекомендаций и мониторинги статусов доменных имен.

При создании таких сервисов огромную помощь оказывают инструменты текстового анализа (текстового майнинга), при помощи которых можно выявить скрытые связи между категориями слов, определить похожие слова, возможные опечатки, провести тематическое индексирование.

Например, если клиентом регистратора доменов является домейнер, то при поиске домена test.online, если он занять ему могут быть интересны домены tests.online, testing.online, тестирование.рф, тестер.сайт и др.

Если же клиент - Вася Иванов, то ему вполне возможно будет интересно купить домен вася.сайт, вася-иванов.рф, иванов.москва, ivanov.online, ivanov.ru и др.

Есть еще один вариант генерации предложений - это применение триграмм в виде поиска по триграммному индексу похожих на поисковую строку продающихся доменов и различные транслитерации, что активно применялось на торговых площадках GoDaddy, Ru-Center.

Применение методом и техник анализа данных становится полезным  как конечному пользователю при покупке домена, так и регистратору доменов, как средство увеличения прибыли.

Тэги: text mining анализ текстов домены интернет


 


 
архив

подписка