Php ile Sayfadaki Tüm Linkleri Toplamak

Bir bot sistemi yazmak istediğinizde genellikle kullanmanız gereken ihtiyaçlardan birisidir diyebilirim. Bot yapımında mantık budur. İlk olarak file_get_contents kullanarak sayfayı komple okumaktır. Ardından file_get_contents kullanarak parçalama işlemi yapabilir ve istediğimiz bütün alanları alabiliriz. Mantıken bize linkler lazım olduğu için <a href=””></a> bölümünü okumamız gerekecek. Php ile Sayfadaki Tüm Linkleri Toplamak için aşağıdaki yolu izlemek yeterli olacaktır.

$page = file_get_contents("https://www.harunalp.com");

preg_match_all("/href=\"([^\"]+)/i",$page,$link);
        
foreach ($link[0] as $row) 
{
    echo $row ."<br>";
}

Çıktı:

href=”https://www.harunalp.com/category/c-sharp/
href=”https://www.harunalp.com/category/javascript/
href=”https://www.harunalp.com/category/php/
href=”https://www.harunalp.com/category/jquery/
href=”https://www.harunalp.com/category/java/
… şeklinde olacaktır.Aynı şekilde sadece bir kategoriye ait yazıları almak istersek de site adresi/category yazarak erişebiliriz.

Eğer linklerin başındaki href yazısını kaldırmak isterseniz basit bir şekilde str_replace kullanarak ortadan kaldırabilirsiniz. Foreach içindeki alanı aşağıdaki gibi düzenleyerek href alanını temizleyebilirsiniz.

echo str_replace('href="','',$tek) ."<br>";

Bu şekilde php ile sayfalardan bilgi toplamak tüm linkleri çekme işlemini rahatlıkla yapabilirsiniz. Bot yapımının ilk ve önemli aşamalarındandır kendileri 🙂

AuthorHarun ALP

Bu adam , bilgi sahibi olduğu konularda makalelerini daha bilgilendirici hale getirip görseller ile süslüyor ve seo uyumlu makaleler ortaya çıkarıyor. Güncel webmaster konularını işlemekten keyif alıyor ve genelde her makale aslında bir sorunun çözümü niteliğinde.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir