Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB58.7570
BTC/USD0.0000
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 12.10.2013, 14:04   #1
Kopch
Senior Member
 
Регистрация: 19.03.2009
Сообщений: 503
Бабло: $116315
По умолчанию Чем можно отсортировать кейворды по языку?

Сила гфб подскажи,

Есть файл на 6-10к строк, в нем вперемешку кейворды на испанском, английском, немецком языках... Как можно отделить зерна от плевел?

Благодарю за подсказки.
Kopch на форуме  
Старый 12.10.2013, 14:20   #2
Юнга
white powder
 
Аватар для Юнга
 
Регистрация: 29.04.2007
Сообщений: 2,649
Бабло: $351100
По умолчанию

как идея - прогнать через гуглотранслейт

http://translate.google.ru/?sl=en&tl...=#auto/en/hola

с параметром auto - пытается определить язык самостоятельно
__________________
господин мойва любит вас
Юнга вне форума  
Старый 12.10.2013, 14:35   #3
Kopch
Senior Member
 
Регистрация: 19.03.2009
Сообщений: 503
Бабло: $116315
ТС -->
автор темы ТС По умолчанию

Спасибо,
впринципе зенкой можно устроить....
А банит транслейт за много запросов?
Kopch на форуме  
Старый 12.10.2013, 14:40   #4
spasibo
banned
 
Регистрация: 14.04.2013
Сообщений: 127
Бабло: $26265
По умолчанию

или вот так
Цитата:
translate.google.ru/translate_a/t?client=x&text=hola&hl=ru&sl=auto&tl=en
Цитата:
{"sentences":[{"trans":"hello","orig":"hola","translit":"","src_ translit":""}],"dict":[{"pos":"междометие","terms":["Hello!","Hi!","Hey!","Hullo!","Hallo!","Hoy!","Ha il!"],"entry":[{"word":"Hello!","reverse_translation":["¡Hola!","¡Caramba!","¡Oiga!","&#16 1;Diga!","¡Bueno!","¡Vale!"],"score":0.43009463},{"word":"Hi!","reverse_transl ation":["¡Hola!"],"score":0.193858847},{"word":"Hey!","reverse_tran slation":["¡Hola!","¡Eh!"],"score":0.0321449488},{"word":"Hullo!","reverse_t ranslation":["¡Hola!","¡Caramba!","¡Oiga!","&#16 1;Diga!","¡Bueno!","¡Aló!"]},{"word":"Hallo!","reverse_translation":["¡Hola!","¡Caramba!","¡Oiga!","&#16 1;Bueno!"]},{"word":"Hoy!","reverse_translation":["¡Eh!","¡Hola!"]},{"word":"Hail!","reverse_translation":["¡Salve!","¡Hola!"]}],"base_form":"¡Hola!","pos_enum":9}],"src":"es","server_time":48}
__________________
не за что
spasibo вне форума  
Старый 12.10.2013, 14:40   #5
Юнга
white powder
 
Аватар для Юнга
 
Регистрация: 29.04.2007
Сообщений: 2,649
Бабло: $351100
По умолчанию

можно через апи за немного денег - https://developers.google.com/transl.../pricing?hl=ru
__________________
господин мойва любит вас
Юнга вне форума  
Старый 12.10.2013, 15:19   #6
Kopch
Senior Member
 
Регистрация: 19.03.2009
Сообщений: 503
Бабло: $116315
ТС -->
автор темы ТС По умолчанию

Всем спасибо, заюзаю пожалуй фичу spasibo
Kopch на форуме  
Старый 12.10.2013, 20:58   #7
NTллигент
Senior Member
 
Аватар для NTллигент
 
Регистрация: 23.04.2007
Адрес: Leopolis
Сообщений: 363
Бабло: $71360
По умолчанию

Недавно юзал http://pear.php.net/package/Text_LanguageDetect - не идеально определяет, но в целом неплохо
__________________
EchoUA: Outsource PHP Development. Offshore PHP Development from Ukraine
NTллигент вне форума  
Старый 12.10.2013, 21:07   #8
RobotAlena
Юниор
 
Аватар для RobotAlena
 
Регистрация: 11.09.2013
Сообщений: 9
Бабло: $3440
По умолчанию

нотебапад ++ или еще что что регулярки подерживает
[^\sА-Яа-ЯЁ-ё0-9] за одно от говна чистит

Последний раз редактировалось RobotAlena; 12.10.2013 в 21:16.
RobotAlena вне форума  
Старый 12.10.2013, 22:02   #9
Kopch
Senior Member
 
Регистрация: 19.03.2009
Сообщений: 503
Бабло: $116315
ТС -->
автор темы ТС По умолчанию

Цитата:
Сообщение от NTллигент Посмотреть сообщение
Недавно юзал http://pear.php.net/package/Text_LanguageDetect - не идеально определяет, но в целом неплохо
Спасиб. гляну

Цитата:
Сообщение от RobotAlena Посмотреть сообщение
нотебапад ++ или еще что что регулярки подерживает
[^\sА-Яа-ЯЁ-ё0-9] за одно от говна чистит
Ну мне не чистить надо, а по полочкам разложить
Kopch на форуме