Всичко за парите от интернет
Регистрирайте се и ще получите ценни съвети и начини да печелите от Интернет.
Напълно безплатно е,и отнема 2 минути!И ако намирате форума за полезен моля гласувайте за нас БГТОП
Всичко за парите от интернет
Регистрирайте се и ще получите ценни съвети и начини да печелите от Интернет.
Напълно безплатно е,и отнема 2 минути!И ако намирате форума за полезен моля гласувайте за нас БГТОП
Всичко за парите от интернет
Would you like to react to this message? Create an account in a few clicks or log in to continue.
Всичко за парите от интернет

Този форум е посветен на всеки, който желае да изкарва пари от интернет и е готов да вложи времето и знанията си в това начинание. Няма да ви кажа, че е супер лесно и бързо да се изкарват пари от интернет, но ще ви покажа стъпка по стъпка как да направите
 
ИндексИндекс  PortalPortal  ГалерияГалерия  Последни снимкиПоследни снимки  ТърсенеТърсене  Регистрирайте сеРегистрирайте се  ВходВход  Моля Гласувайте за насМоля Гласувайте за нас  
Social bookmarking
Social bookmarking reddit      

Bookmark and share the address of Всичко за парите от интернет on your social bookmarking website
Most Viewed Topics
20 изпитани начина за доходи от интернет
Как да прехвърляме файлове между два компютъра без мрежова карта, използвайки паралелния (принтерски) порт. Кабел за връзка.
Инсталиране на Windows 7 или Windows Vista от USB флашка
Метод: Как да си набавя директни реферали (ДР)
Продавам безжична клавиатура с вградена мишка.
Пари с изпращане на SMS
КАК ДА ИЗТРИЯ ПРОГРАМА ОТ БРАУЗЪРА
Пари от къщи, само с копи и пейст от amazon в eBay
Как да ремонтираме компютърно дъно с повреда в DC/DC стабилизатора на напр.
Висококачествени аудиокурсове - немски, френски и английски
Latest topics
» Какво мислите за Образованието в България
PHP: Извличане текст от интернет страница Icon_minitimeby Boman Пет Фев 07, 2020 12:09 pm

» как да си проверявам натрупаните пари от интернета /биткойни,догекойни и други/в портфейлите ми
PHP: Извличане текст от интернет страница Icon_minitimeby snarpim Нед Юли 01, 2018 11:46 am

» THWGlobal.com
PHP: Извличане текст от интернет страница Icon_minitimeby v5901 Съб Окт 01, 2016 12:29 pm

» Изкарвайте пари докато спеделяте продуктите, който харесвате
PHP: Извличане текст от интернет страница Icon_minitimeby Admin Сря Сеп 23, 2015 2:16 pm

» Безплатна книга за оптимизация на страници
PHP: Извличане текст от интернет страница Icon_minitimeby Admin Пон Апр 20, 2015 11:46 pm

» Изкарвайте пари от знанията си
PHP: Извличане текст от интернет страница Icon_minitimeby Admin Нед Дек 14, 2014 2:14 pm

» Писане на авторски статии
PHP: Извличане текст от интернет страница Icon_minitimeby Admin Пет Юли 11, 2014 3:54 am

» Спечели лесни 10 долара в Пейпал
PHP: Извличане текст от интернет страница Icon_minitimeby eminemka91 Пет Юни 20, 2014 7:30 pm

» Пари от къщи, само с копи и пейст от amazon в eBay
PHP: Извличане текст от интернет страница Icon_minitimeby DropShipper F Пон Апр 21, 2014 11:47 pm

» ПЕЧЕЛЕТЕ ОТ ДО $3000 МЕСЕЧНО
PHP: Извличане текст от интернет страница Icon_minitimeby pacony Чет Дек 26, 2013 10:25 am

Приятели
Смешни вицове,снимки и карикатури

Share | 
 

 PHP: Извличане текст от интернет страница

Предишната тема Следващата тема Go down 
АвторСъобщение
TheGamer

TheGamer

Posts : 122
Points : 300
Reputation : 22
Join date : 08.12.2009

Character sheet
game:

PHP: Извличане текст от интернет страница Empty
ПисанеЗаглавие: PHP: Извличане текст от интернет страница   PHP: Извличане текст от интернет страница Icon_minitimeСъб Яну 02, 2010 1:57 pm

Един примерен скрипт за извличане на текстово съдържание от интернет страница.
Ползва функцията get_page_content($url), която извлича цялото съдържание на страница – пълния HTML документ. Тази функция ползва CURL библиотеката. Ако в инсталацията на PHP няма разширението CURL, скрипта ще даде грешка. Повечето хостинги имат по подразбиране CURL. Така, че това не би трябвало да е проблем. Препоръчвам използването на тази функция вместо вградените в PHP средства, защото може да се задава време за изчакване, както за свързване, така и за цялостна обработка. Ако това време изтече скрипта продължава работа без да дава грешка. По подразбиране съм задал 10 сек за свързване и 20 за извличане на страницата. Ако се очаква страниците да бъдат много дълги може времето да се увеличи от 20 на 30 сек.

$url = 'http://ganbox.com/news'; # адрес на страницата, която ще се извлича

$html = get_page_content($url);

$html = preg_replace('|^(.*?)$html = preg_replace('|(.*)$|si','',$html); # всичко след затварящ таг body се изтрива (ако има таг)
$aBlockTags = array('form','noscript','script','style','object');
foreach($aBlockTags as $blockTag){
$html = preg_replace('|<'.$blockTag.'(.*?)|si','',$html); # изчистване на някои блокови тагове, между които не се очаква да има текст
}
#$aSpecialDivs = array('header','head','top','menu','menuBar','footer','foot');
$text = strip_tags($html); # премахва тагове
$text = html_entity_decode($text); # превръща HTML спец. символи в съответните знаци. Напр. < става < и " става "
print $text;

exit;

/**
* Извличане на съдържанието на уеб страница
* @param string $url - адрес на уеб страница, от която се извлича текст
* @param int $CURLOPT_CONNECTTIMEOUT optional - максимално изчакване за свързване в сек.
* @param int $CURLOPT_TIMEOUT optional - време за цялостна обработка в сек.
* @return string - целият HTML документ на страницата
**/
function get_page_content($url, $CURLOPT_CONNECTTIMEOUT=10, $CURLOPT_TIMEOUT=20){
$ch = curl_init ();
@curl_setopt($ch, CURLOPT_URL, $url);
@curl_setopt($ch, CURLOPT_HEADER, false); /* без HTTP headers */
@curl_setopt ( $ch, CURLOPT_CONNECTTIMEOUT, $CURLOPT_CONNECTTIMEOUT ); /* време за свързване */
@curl_setopt ( $ch, CURLOPT_TIMEOUT, $CURLOPT_TIMEOUT ); /* общо време за изпълнение */
@curl_setopt ( $ch, CURLOPT_RETURNTRANSFER, true );
@curl_setopt ( $ch, CURLOPT_FOLLOWLOCATION, true );
@curl_setopt ( $ch, CURLOPT_USERAGENT, $_SERVER ['HTTP_USER_AGENT'] );
$data = curl_exec ( $ch );
curl_close($ch);
return $data;
}В сегашния си вид скрипта извлича всички текстове между body таговете, като премахва CSS, Javascript и някои блокови тагове заедно с кода между тях. Текстовете от хедъра, футъра и менюто остават.
След като извлече текста този скрипт просто го отпечатва на екрана, но ти можеш да направиш и други неща с него.
Все пак добре помисли какво ще правиш с него! Възможно е текста да е защитен от Закон за авторското право и сродните му права и да нямаш право да го публикуваш без разрешението на автора.
Напомням ти още веднъж, че ако вземаш текст от друг сайт и го показваш в твои сайт е задължително да поставиш реален линк към източника. В противен случай е много вероятно да получиш наказание от Гугъл за дублирано съдържание и сайта ти да падне назад в резултатите на Гугъл.
Кодът е тестван и работи. За всякакви идеи за подобрение и забележки, пиши коментари по публикацията.Smile
Върнете се в началото Go down
 

PHP: Извличане текст от интернет страница

Предишната тема Следващата тема Върнете се в началото 
Страница 1 от 1

Права за този форум:Не Можете да отговаряте на темите
Всичко за парите от интернет :: Програмиране-
Create a forum on Forumotion | Computers and Internet | Internet | ©phpBB | Поддръжка на форума | Сигнал за злоупотреба | Последните дискусии