лена программа HTMLStripper.cp
Автор admin
Четверг, 14 мая 2009 11:32
лена программа HTMLStripper.cpp, удалявшая из текстового файла теги HTML и специальные символы. Тогда мы пообещали, что представим более элегантное решение с использованием строковых потоков: //: С04:HTMLStПррег2.срр {RunByHand} //{L} ../СОЗ/ReplaceAl1 // Фильтр для удаления тегов и маркеров HTML #include #i nclude #i nclude #include #include #i nclude #i nclude #1 nclude “../СОЗ/ReplaceAl1.h” #include “../require.h” using namespace std; strings stripHTMLTags(string& s) throw(runtime_error) { size_t leftPos; while ((leftPos = s.find(‘<')) != string::npos) { size_t rightPos = s.find('>‘. leftPos+1); if (rightPos == string::npos) { ostringstream msg; msg « “Incomplete HTML tag starting in position ” « leftPos; throw runtime_error(msg.str()); } s.erase(leftPos, rightPos – leftPos +1): } // Удаление всех специальных символов HTML replaceAl1(s. “<:”. “<"); replaceAl1(s. ">". ">“); replaceAlKs. “&”, “&”): replaceAl1(s. “ ”. ” “); // И т. д. return s; int main(int argc, char* argv[]) { requireArgs(argc. 1. “usage: HTMLStrippe
Комментарии закрыты.
Последние комментарии