|
| Дата |
|
USD/RUB | 93.4409 | BTC/USD | 66358.0951 |
|
|
|
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии. |
02.06.2010, 11:39
|
#1
|
Senior Member
Регистрация: 22.06.2008
Сообщений: 603
Бабло: $122240
|
Скрипт/прога для чистки текста, поделитесь плиз.
Сабж. Нужно почистить текст, от всяких нижних пробелов, двойных пробелов, левых символов и тд. Если есть у кого софтина более ли менее универсальная, поделитесь плиз, регулярки мне не надо сюда копировать
|
|
|
02.06.2010, 11:41
|
#2
|
Senior Medved
Регистрация: 15.06.2008
Сообщений: 4,146
Бабло: $22479945
|
|
|
|
02.06.2010, 13:14
|
#3
|
Senior Member
Регистрация: 15.11.2008
Сообщений: 13,230
Бабло: $247845871
|
Цитата:
регулярки мне не надо сюда копировать
|
а я бы не отказался от регулярок
|
|
|
02.06.2010, 13:38
|
#4
|
Senior Member
Регистрация: 26.09.2008
Сообщений: 3,967
Бабло: $504639
|
Любой текстовый редактор "заменить всё"
|
|
|
02.06.2010, 13:42
|
#5
|
Senior Member
Регистрация: 28.05.2007
Сообщений: 1,951
Бабло: $349943
|
notepad++
|
|
|
02.06.2010, 14:04
|
#6
|
Yea!
Регистрация: 15.02.2008
Сообщений: 2,325
Бабло: $313955
|
textpipe
__________________
|
|
|
02.06.2010, 14:21
|
#7
|
Senior Member
Регистрация: 25.06.2007
Сообщений: 1,491
Бабло: $490772
|
это сохрани в файл с расширением .hta
потом даблклик
в риплейсы добавь мусор, от которого надо избавиться
<head>
<title>Ояебу</title>
<HTA:APPLICATION
SCROLL="no"
SINGLEINSTANCE="no"
WINDOWSTATE="maximize"
>
</head>
<script language="VBScript">
Sub ClearContent
my = Content.Value
my = Replace (my, " ", "")
my = Replace (my, "_", "")
my = Replace (my, "...", "")
ClearedContent.Value = my
End Sub
</script>
<body STYLE="font:10 pt arial; color:#black;" bgcolor = "#494949">
<br>контент<br>
<textarea style="background-color:#9f9177; color:#6a614f" name="Content" rows="10" cols="100"></textarea>
<br>
<input type="button" style="background-color:#5c5342; color:#ff8c00; width: 160px" value="почистить" onClick="ClearContent"><br>
<br><br>чищенное:<br>
<textarea style="background-color:#9f9177; color:#6a614f" name="ClearedContent" rows="10" cols="100"></textarea><br>
</body>
__________________
Talitha kumi!
|
|
|
03.06.2010, 20:23
|
#8
|
Senior Member
Регистрация: 22.06.2008
Сообщений: 603
Бабло: $122240
ТС -->
|
ТС
апну топик, народ подскажите как убрать русские буквы из текста, сейчас заметил что проскакиваю какого-то хера, можно и регулярками, хоть чем короче)
|
|
|
03.06.2010, 20:26
|
#9
|
Je suis moine ivre
Регистрация: 03.03.2009
Сообщений: 15,268
Бабло: $797172957
|
А чем фильтрануть от всяких инопланетянских символов? Я контент на один рес запостить не мог, окзалось из-за какого-то злоебучего спаршенного спецсимвола.
По идее надо все кроме [a-zA-Z0-9] и обычных точек, тире и запятых на фильтре оставлять...
|
|
|
03.06.2010, 20:28
|
#10
|
конверчу-хуеверчу
Регистрация: 16.09.2009
Сообщений: 605
Бабло: $103180
|
Цитата:
Сообщение от dmjROV
апну топик, народ подскажите как убрать русские буквы из текста, сейчас заметил что проскакиваю какого-то хера, можно и регулярками, хоть чем короче)
|
PHP код:
function rustoeng($string) {//change russian symbols in latin $oborot = array("А"=>"A", "Е"=>"E","И"=>"U","В"=>"B", "К"=>"K","М"=>"M","Н"=>"H", "О"=>"O","Р"=>"P","С"=>"C", "Т"=>"T","У"=>"Y","Х"=>"X", "а"=>"a","е"=>"e","и"=>"u", "м"=>"m","о"=>"o","р"=>"p", "с"=>"c","т"=>"t","у"=>"y", "х"=>"x","к"=>"k", ); $result= strtr($string, $oborot); return $result; }
Пьяный такое?
PHP код:
<?php // $document на выходе должен содержать HTML-документ. // Необходимо удалить все HTML-теги, секции javascript, // пробельные символы. Также необходимо заменить некоторые // HTML-сущности на их эквивалент.
$search = array ("'<script[^>]*?>.*?</script>'si", // Вырезает javaScript "'<[\/\!]*?[^<>]*?>'si", // Вырезает HTML-теги "'([\r\n])[\s]+'", // Вырезает пробельные символы "'&(quot|#34);'i", // Заменяет HTML-сущности "'&(amp|#38);'i", "'&(lt|#60);'i", "'&(gt|#62);'i", "'&(nbsp|#160);'i", "'&(iexcl|#161);'i", "'&(cent|#162);'i", "'&(pound|#163);'i", "'&(copy|#169);'i", "'&#(\d+);'e"); // интерпретировать как php-код
$replace = array ("", "", "\\1", "\"", "&", "<", ">", " ", chr(161), chr(162), chr(163), chr(169), "chr(\\1)");
$text = preg_replace($search, $replace, $document); ?>
ну бля, тут лишнее по вкусу снеси.
|
|
|
|