ฉันจะตรวจสอบว่ามี URL อยู่ใน PHP หรือไม่


คำตอบ:


296

ที่นี่:

$file = 'http://www.domain.com/somefile.jpg';
$file_headers = @get_headers($file);
if(!$file_headers || $file_headers[0] == 'HTTP/1.1 404 Not Found') {
    $exists = false;
}
else {
    $exists = true;
}

จากที่นี่และด้านล่างโพสต์ด้านบนมีวิธีแก้ปัญหาขด :

function url_exists($url) {
    if (!$fp = curl_init($url)) return false;
    return true;
}

18
ฉันกลัวว่าวิธี CURL จะไม่ทำงานเช่นนี้ ลองดูสิ: stackoverflow.com/questions/981954/…
viam0Zah

4
บางเว็บไซต์มี$file_headers[0]หน้าข้อผิดพลาดแตกต่างกัน ตัวอย่างเช่น youtube.com หน้าข้อผิดพลาดที่มีค่านั้นเป็นHTTP/1.0 404 Not Found(ต่างกันคือ 1.0 และ 1.1) ถ้าอย่างนั้นจะทำอย่างไร?
กฤษณะราชา K

21
บางทีการใช้strpos($headers[0], '404 Not Found')อาจทำกลอุบาย
alexandru.topliceanu

12
@ Mark เห็นด้วย! เพื่อชี้แจงstrpos($headers[0], '404')จะดีกว่า!
alexandru.topliceanu

1
@ karim79 ระวังการโจมตี SSRF และ XSPA
M Rostami

55

เมื่อทราบว่ามี URL จาก php อยู่หรือไม่มีบางสิ่งที่ควรคำนึงถึง:

  • URL นั้นใช้ได้จริงหรือไม่ (สตริง, ไม่ว่างเปล่า, ไวยากรณ์ที่ดี) นี่เป็นการตรวจสอบฝั่งเซิร์ฟเวอร์อย่างรวดเร็ว
  • การรอการตอบสนองอาจใช้เวลาและการเรียกใช้โค้ดบล็อก
  • ไม่ใช่ส่วนหัวที่ส่งคืนโดย get_headers () เท่านั้นที่มีรูปแบบที่ดี
  • ใช้ขด (ถ้าคุณสามารถ)
  • ป้องกันการดึงเนื้อหา / เนื้อหาทั้งหมด แต่ร้องขอเฉพาะส่วนหัว
  • พิจารณาเปลี่ยนเส้นทาง URL:
    • คุณต้องการส่งคืนรหัสแรกหรือไม่
    • หรือติดตามการเปลี่ยนเส้นทางทั้งหมดและส่งคืนรหัสสุดท้าย?
    • คุณอาจท้ายด้วย 200 แต่มันสามารถเปลี่ยนเส้นทางโดยใช้เมตาแท็กหรือจาวาสคริปต์ การหาว่าเกิดอะไรขึ้นหลังจากนั้นยาก

โปรดทราบว่าวิธีการใดก็ตามที่คุณใช้จะต้องใช้เวลาในการรอการตอบกลับ
รหัสทั้งหมดอาจ (และอาจจะ) หยุดจนกว่าคุณจะรู้ผลหรือคำขอหมดเวลา

ตัวอย่างเช่นรหัสด้านล่างอาจใช้เวลานานในการแสดงหน้าหาก URL ไม่ถูกต้องหรือไม่สามารถเข้าถึงได้:

<?php
$urls = getUrls(); // some function getting say 10 or more external links

foreach($urls as $k=>$url){
  // this could potentially take 0-30 seconds each
  // (more or less depending on connection, target site, timeout settings...)
  if( ! isValidUrl($url) ){
    unset($urls[$k]);
  }
}

echo "yay all done! now show my site";
foreach($urls as $url){
  echo "<a href=\"{$url}\">{$url}</a><br/>";
}

ฟังก์ชั่นด้านล่างอาจเป็นประโยชน์คุณอาจต้องการแก้ไขให้เหมาะกับความต้องการของคุณ:

    function isValidUrl($url){
        // first do some quick sanity checks:
        if(!$url || !is_string($url)){
            return false;
        }
        // quick check url is roughly a valid http request: ( http://blah/... ) 
        if( ! preg_match('/^http(s)?:\/\/[a-z0-9-]+(\.[a-z0-9-]+)*(:[0-9]+)?(\/.*)?$/i', $url) ){
            return false;
        }
        // the next bit could be slow:
        if(getHttpResponseCode_using_curl($url) != 200){
//      if(getHttpResponseCode_using_getheaders($url) != 200){  // use this one if you cant use curl
            return false;
        }
        // all good!
        return true;
    }

    function getHttpResponseCode_using_curl($url, $followredirects = true){
        // returns int responsecode, or false (if url does not exist or connection timeout occurs)
        // NOTE: could potentially take up to 0-30 seconds , blocking further code execution (more or less depending on connection, target site, and local timeout settings))
        // if $followredirects == false: return the FIRST known httpcode (ignore redirects)
        // if $followredirects == true : return the LAST  known httpcode (when redirected)
        if(! $url || ! is_string($url)){
            return false;
        }
        $ch = @curl_init($url);
        if($ch === false){
            return false;
        }
        @curl_setopt($ch, CURLOPT_HEADER         ,true);    // we want headers
        @curl_setopt($ch, CURLOPT_NOBODY         ,true);    // dont need body
        @curl_setopt($ch, CURLOPT_RETURNTRANSFER ,true);    // catch output (do NOT print!)
        if($followredirects){
            @curl_setopt($ch, CURLOPT_FOLLOWLOCATION ,true);
            @curl_setopt($ch, CURLOPT_MAXREDIRS      ,10);  // fairly random number, but could prevent unwanted endless redirects with followlocation=true
        }else{
            @curl_setopt($ch, CURLOPT_FOLLOWLOCATION ,false);
        }
//      @curl_setopt($ch, CURLOPT_CONNECTTIMEOUT ,5);   // fairly random number (seconds)... but could prevent waiting forever to get a result
//      @curl_setopt($ch, CURLOPT_TIMEOUT        ,6);   // fairly random number (seconds)... but could prevent waiting forever to get a result
//      @curl_setopt($ch, CURLOPT_USERAGENT      ,"Mozilla/5.0 (Windows NT 6.0) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/21.0.1180.89 Safari/537.1");   // pretend we're a regular browser
        @curl_exec($ch);
        if(@curl_errno($ch)){   // should be 0
            @curl_close($ch);
            return false;
        }
        $code = @curl_getinfo($ch, CURLINFO_HTTP_CODE); // note: php.net documentation shows this returns a string, but really it returns an int
        @curl_close($ch);
        return $code;
    }

    function getHttpResponseCode_using_getheaders($url, $followredirects = true){
        // returns string responsecode, or false if no responsecode found in headers (or url does not exist)
        // NOTE: could potentially take up to 0-30 seconds , blocking further code execution (more or less depending on connection, target site, and local timeout settings))
        // if $followredirects == false: return the FIRST known httpcode (ignore redirects)
        // if $followredirects == true : return the LAST  known httpcode (when redirected)
        if(! $url || ! is_string($url)){
            return false;
        }
        $headers = @get_headers($url);
        if($headers && is_array($headers)){
            if($followredirects){
                // we want the the last errorcode, reverse array so we start at the end:
                $headers = array_reverse($headers);
            }
            foreach($headers as $hline){
                // search for things like "HTTP/1.1 200 OK" , "HTTP/1.0 200 OK" , "HTTP/1.1 301 PERMANENTLY MOVED" , "HTTP/1.1 400 Not Found" , etc.
                // note that the exact syntax/version/output differs, so there is some string magic involved here
                if(preg_match('/^HTTP\/\S+\s+([1-9][0-9][0-9])\s+.*/', $hline, $matches) ){// "HTTP/*** ### ***"
                    $code = $matches[1];
                    return $code;
                }
            }
            // no HTTP/xxx found in headers:
            return false;
        }
        // no headers :
        return false;
    }

ด้วยเหตุผลบางอย่าง getHttpResponseCode_using_curl () จะคืนค่า 200 เสมอในกรณีของฉัน
TD_Nijboer

2
หากใครบางคนมีปัญหาเดียวกันให้ตรวจสอบ dns-nameservers .. ให้ใช้ opendns โดยไม่มี followredirects stackoverflow.com/a/11072947/1829460
TD_Nijboer

+1 สำหรับการเป็นคำตอบเดียวที่จะจัดการกับการเปลี่ยนเส้นทาง เปลี่ยนเป็นreturn $codeเพื่อif($code == 200){return true;} return false;จัด
เรียงความ

@PKHunter: ไม่ preg_match regex ของฉันเป็นตัวอย่างง่ายๆและจะไม่ตรงกับ URL ทั้งหมดที่ระบุไว้ในนั้น ดู url การทดสอบนี้: regex101.com/r/EpyDDc/2 หากคุณต้องการดีกว่าให้แทนที่ด้วยรายการที่ระบุไว้ในลิงค์ของคุณ ( mathiasbynens.be/demo/url-regex ) จาก diegoperini; ดูเหมือนว่าจะตรงกับพวกเขาทั้งหมดให้ดู testlink นี้: regex101.com/r/qMQp23/1
MoonLite

46
$headers = @get_headers($this->_value);
if(strpos($headers[0],'200')===false)return false;

ดังนั้นเมื่อใดก็ตามที่คุณติดต่อเว็บไซต์และได้รับอย่างอื่นมากกว่า 200 ok มันจะทำงาน


13
แต่ถ้าหากมันเป็นการเปลี่ยนเส้นทาง โดเมนยังคงใช้งานได้ แต่จะถูกปล่อยออกไป
Eric Leroy

4
เหนือเส้นหนึ่ง: return strpos(@get_headers($url)[0],'200') === false ? false : true. อาจจะมีประโยชน์
Dejv

$ นี่คือใน PHP เป็นการอ้างอิงถึงวัตถุปัจจุบัน การอ้างอิง: php.net/manual/en/language.oop5.basic.phpไพรเมอร์: phpro.org/tutorials/Object-Oriented-Programming-with-PHP.html ส่วนใหญ่มีแนวโน้มว่าข้อมูลโค้ดถูกนำมาจากชั้นเรียนและไม่คงที่ตามนั้น .
Marc Witteveen

18

คุณไม่สามารถใช้ curl ในบางเซิร์ฟเวอร์คุณสามารถใช้รหัสนี้ได้

<?php
$url = 'http://www.example.com';
$array = get_headers($url);
$string = $array[0];
if(strpos($string,"200"))
  {
    echo 'url exists';
  }
  else
  {
    echo 'url does not exist';
  }
?>

อาจไม่ทำงานสำหรับการเปลี่ยนเส้นทาง 302-303 หรือตัวอย่างเช่น 304 Not Modified
Zippp

8
$url = 'http://google.com';
$not_url = 'stp://google.com';

if (@file_get_contents($url)): echo "Found '$url'!";
else: echo "Can't find '$url'.";
endif;
if (@file_get_contents($not_url)): echo "Found '$not_url!";
else: echo "Can't find '$not_url'.";
endif;

// Found 'http://google.com'!Can't find 'stp://google.com'.

2
สิ่งนี้จะใช้งานไม่ได้หากปิดใช้งาน allow-url-fopen - php.net/manual/en/…
Daniel Paul Searles

2
ฉันขอแนะนำให้อ่านเฉพาะไบต์แรกเท่านั้น ... ถ้า (@file_get_contents ($ url, เท็จ, NULL, 0,1))
Daniel Valland

8
function URLIsValid($URL)
{
    $exists = true;
    $file_headers = @get_headers($URL);
    $InvalidHeaders = array('404', '403', '500');
    foreach($InvalidHeaders as $HeaderVal)
    {
            if(strstr($file_headers[0], $HeaderVal))
            {
                    $exists = false;
                    break;
            }
    }
    return $exists;
}

8

ฉันใช้ฟังก์ชั่นนี้:

/**
 * @param $url
 * @param array $options
 * @return string
 * @throws Exception
 */
function checkURL($url, array $options = array()) {
    if (empty($url)) {
        throw new Exception('URL is empty');
    }

    // list of HTTP status codes
    $httpStatusCodes = array(
        100 => 'Continue',
        101 => 'Switching Protocols',
        102 => 'Processing',
        200 => 'OK',
        201 => 'Created',
        202 => 'Accepted',
        203 => 'Non-Authoritative Information',
        204 => 'No Content',
        205 => 'Reset Content',
        206 => 'Partial Content',
        207 => 'Multi-Status',
        208 => 'Already Reported',
        226 => 'IM Used',
        300 => 'Multiple Choices',
        301 => 'Moved Permanently',
        302 => 'Found',
        303 => 'See Other',
        304 => 'Not Modified',
        305 => 'Use Proxy',
        306 => 'Switch Proxy',
        307 => 'Temporary Redirect',
        308 => 'Permanent Redirect',
        400 => 'Bad Request',
        401 => 'Unauthorized',
        402 => 'Payment Required',
        403 => 'Forbidden',
        404 => 'Not Found',
        405 => 'Method Not Allowed',
        406 => 'Not Acceptable',
        407 => 'Proxy Authentication Required',
        408 => 'Request Timeout',
        409 => 'Conflict',
        410 => 'Gone',
        411 => 'Length Required',
        412 => 'Precondition Failed',
        413 => 'Payload Too Large',
        414 => 'Request-URI Too Long',
        415 => 'Unsupported Media Type',
        416 => 'Requested Range Not Satisfiable',
        417 => 'Expectation Failed',
        418 => 'I\'m a teapot',
        422 => 'Unprocessable Entity',
        423 => 'Locked',
        424 => 'Failed Dependency',
        425 => 'Unordered Collection',
        426 => 'Upgrade Required',
        428 => 'Precondition Required',
        429 => 'Too Many Requests',
        431 => 'Request Header Fields Too Large',
        449 => 'Retry With',
        450 => 'Blocked by Windows Parental Controls',
        500 => 'Internal Server Error',
        501 => 'Not Implemented',
        502 => 'Bad Gateway',
        503 => 'Service Unavailable',
        504 => 'Gateway Timeout',
        505 => 'HTTP Version Not Supported',
        506 => 'Variant Also Negotiates',
        507 => 'Insufficient Storage',
        508 => 'Loop Detected',
        509 => 'Bandwidth Limit Exceeded',
        510 => 'Not Extended',
        511 => 'Network Authentication Required',
        599 => 'Network Connect Timeout Error'
    );

    $ch = curl_init($url);
    curl_setopt($ch, CURLOPT_NOBODY, true);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);

    if (isset($options['timeout'])) {
        $timeout = (int) $options['timeout'];
        curl_setopt($ch, CURLOPT_TIMEOUT, $timeout);
    }

    curl_exec($ch);
    $returnedStatusCode = curl_getinfo($ch, CURLINFO_HTTP_CODE);
    curl_close($ch);

    if (array_key_exists($returnedStatusCode, $httpStatusCodes)) {
        return "URL: '{$url}' - Error code: {$returnedStatusCode} - Definition: {$httpStatusCodes[$returnedStatusCode]}";
    } else {
        return "'{$url}' does not exist";
    }
}

5

โซลูชัน get_headers () ของ karim79 ไม่ได้ผลสำหรับฉันเพราะฉันได้ผลลัพธ์ที่บ้าด้วย Pinterest

get_headers(): SSL operation failed with code 1. OpenSSL Error messages: error:14090086:SSL routines:SSL3_GET_SERVER_CERTIFICATE:certificate verify failed

Array
(
    [url] => https://www.pinterest.com/jonathan_parl/
    [exists] => 
)

get_headers(): Failed to enable crypto

Array
(
    [url] => https://www.pinterest.com/jonathan_parl/
    [exists] => 
)

get_headers(https://www.pinterest.com/jonathan_parl/): failed to open stream: operation failed

Array
(
    [url] => https://www.pinterest.com/jonathan_parl/
    [exists] => 
) 

อย่างไรก็ตามผู้พัฒนานี้แสดงให้เห็นว่า cURL นั้นเร็วกว่า get_headers ():

http://php.net/manual/fr/function.get-headers.php#104723

เนื่องจากหลาย ๆ คนร้องขอให้ karim79 แก้ไขเป็นโซลูชัน cURL นี่คือโซลูชันที่ฉันสร้างขึ้นในวันนี้

/**
* Send an HTTP request to a the $url and check the header posted back.
*
* @param $url String url to which we must send the request.
* @param $failCodeList Int array list of code for which the page is considered invalid.
*
* @return Boolean
*/
public static function isUrlExists($url, array $failCodeList = array(404)){

    $exists = false;

    if(!StringManager::stringStartWith($url, "http") and !StringManager::stringStartWith($url, "ftp")){

        $url = "https://" . $url;
    }

    if (preg_match(RegularExpression::URL, $url)){

        $handle = curl_init($url);


        curl_setopt($handle, CURLOPT_RETURNTRANSFER, true);

        curl_setopt($handle, CURLOPT_SSL_VERIFYPEER, false);

        curl_setopt($handle, CURLOPT_HEADER, true);

        curl_setopt($handle, CURLOPT_NOBODY, true);

        curl_setopt($handle, CURLOPT_USERAGENT, true);


        $headers = curl_exec($handle);

        curl_close($handle);


        if (empty($failCodeList) or !is_array($failCodeList)){

            $failCodeList = array(404); 
        }

        if (!empty($headers)){

            $exists = true;

            $headers = explode(PHP_EOL, $headers);

            foreach($failCodeList as $code){

                if (is_numeric($code) and strpos($headers[0], strval($code)) !== false){

                    $exists = false;

                    break;  
                }
            }
        }
    }

    return $exists;
}

ให้ฉันอธิบายตัวเลือก curl:

CURLOPT_RETURNTRANSFER : คืนค่าสตริงแทนที่จะแสดงหน้าการโทรบนหน้าจอ

CURLOPT_SSL_VERIFYPEER : cUrl จะไม่ชำระเงินใบรับรอง

CURLOPT_HEADER : รวมส่วนหัวในสตริง

CURLOPT_NOBODY : ไม่รวมเนื้อหาในสตริง

CURLOPT_USERAGENT : บางไซต์ต้องการให้ทำงานได้อย่างถูกต้อง (ตัวอย่าง: https://plus.google.com )


หมายเหตุเพิ่มเติม : ในฟังก์ชันนี้ฉันใช้ Regex ของ Diego Perini เพื่อตรวจสอบความถูกต้องของ URL ก่อนส่งคำขอ:

const URL = "%^(?:(?:https?|ftp)://)(?:\S+(?::\S*)?@|\d{1,3}(?:\.\d{1,3}){3}|(?:(?:[a-z\d\x{00a1}-\x{ffff}]+-?)*[a-z\d\x{00a1}-\x{ffff}]+)(?:\.(?:[a-z\d\x{00a1}-\x{ffff}]+-?)*[a-z\d\x{00a1}-\x{ffff}]+)*(?:\.[a-z\x{00a1}-\x{ffff}]{2,6}))(?::\d+)?(?:[^\s]*)?$%iu"; //@copyright Diego Perini

หมายเหตุเพิ่มเติม 2 : ฉันระเบิดสตริงส่วนหัวและส่วนหัวของผู้ใช้ [0] เพื่อให้แน่ใจว่าจะตรวจสอบเฉพาะรหัสส่งคืนและข้อความเท่านั้น (เช่น: 200, 404, 405 ฯลฯ )

หมายเหตุเพิ่มเติม 3 : บางครั้งการตรวจสอบเฉพาะรหัส 404 นั้นไม่เพียงพอ (ดูการทดสอบหน่วย) ดังนั้นจึงมีพารามิเตอร์ $ failCodeList ที่เป็นตัวเลือกเพื่อจัดหารายการรหัสทั้งหมดเพื่อปฏิเสธ

และแน่นอนนี่คือการทดสอบหน่วย (รวมถึงเครือข่ายสังคมยอดนิยมทั้งหมด) เพื่อรับรองการเข้ารหัสของฉัน:

public function testIsUrlExists(){

//invalid
$this->assertFalse(ToolManager::isUrlExists("woot"));

$this->assertFalse(ToolManager::isUrlExists("https://www.facebook.com/jonathan.parentlevesque4545646456"));

$this->assertFalse(ToolManager::isUrlExists("https://plus.google.com/+JonathanParentL%C3%A9vesque890800"));

$this->assertFalse(ToolManager::isUrlExists("https://instagram.com/mariloubiz1232132/", array(404, 405)));

$this->assertFalse(ToolManager::isUrlExists("https://www.pinterest.com/jonathan_parl1231/"));

$this->assertFalse(ToolManager::isUrlExists("https://regex101.com/546465465456"));

$this->assertFalse(ToolManager::isUrlExists("https://twitter.com/arcadefire4566546"));

$this->assertFalse(ToolManager::isUrlExists("https://vimeo.com/**($%?%$", array(400, 405)));

$this->assertFalse(ToolManager::isUrlExists("https://www.youtube.com/user/Darkjo666456456456"));


//valid
$this->assertTrue(ToolManager::isUrlExists("www.google.ca"));

$this->assertTrue(ToolManager::isUrlExists("https://www.facebook.com/jonathan.parentlevesque"));

$this->assertTrue(ToolManager::isUrlExists("https://plus.google.com/+JonathanParentL%C3%A9vesque"));

$this->assertTrue(ToolManager::isUrlExists("https://instagram.com/mariloubiz/"));

$this->assertTrue(ToolManager::isUrlExists("https://www.facebook.com/jonathan.parentlevesque"));

$this->assertTrue(ToolManager::isUrlExists("https://www.pinterest.com/"));

$this->assertTrue(ToolManager::isUrlExists("https://regex101.com"));

$this->assertTrue(ToolManager::isUrlExists("https://twitter.com/arcadefire"));

$this->assertTrue(ToolManager::isUrlExists("https://vimeo.com/"));

$this->assertTrue(ToolManager::isUrlExists("https://www.youtube.com/user/Darkjo666"));
}

ความสำเร็จที่ยิ่งใหญ่สำหรับทุกคน

Jonathan Parent-Lévesqueจาก Montreal


4
function urlIsOk($url)
{
    $headers = @get_headers($url);
    $httpStatus = intval(substr($headers[0], 9, 3));
    if ($httpStatus<400)
    {
        return true;
    }
    return false;
}

3

ค่อนข้างเร็ว:

function http_response($url){
    $resURL = curl_init(); 
    curl_setopt($resURL, CURLOPT_URL, $url); 
    curl_setopt($resURL, CURLOPT_BINARYTRANSFER, 1); 
    curl_setopt($resURL, CURLOPT_HEADERFUNCTION, 'curlHeaderCallback'); 
    curl_setopt($resURL, CURLOPT_FAILONERROR, 1); 
    curl_exec ($resURL); 
    $intReturnCode = curl_getinfo($resURL, CURLINFO_HTTP_CODE); 
    curl_close ($resURL); 
    if ($intReturnCode != 200 && $intReturnCode != 302 && $intReturnCode != 304) { return 0; } else return 1;
}

echo 'google:';
echo http_response('http://www.google.com');
echo '/ ogogle:';
echo http_response('http://www.ogogle.com');

วิธีที่ซับซ้อนมากเกินไป :) stackoverflow.com/questions/981954/...
แจ็ค

ฉันได้รับข้อยกเว้นนี้เมื่อ url มีอยู่: ไม่สามารถเรียก CURLOPT_HEADERFUNCTION
safiot

3

วิธีแก้ปัญหาทั้งหมดข้างต้น + น้ำตาลพิเศษ (สุดยอดโซลูชั่น AIO)

/**
 * Check that given URL is valid and exists.
 * @param string $url URL to check
 * @return bool TRUE when valid | FALSE anyway
 */
function urlExists ( $url ) {
    // Remove all illegal characters from a url
    $url = filter_var($url, FILTER_SANITIZE_URL);

    // Validate URI
    if (filter_var($url, FILTER_VALIDATE_URL) === FALSE
        // check only for http/https schemes.
        || !in_array(strtolower(parse_url($url, PHP_URL_SCHEME)), ['http','https'], true )
    ) {
        return false;
    }

    // Check that URL exists
    $file_headers = @get_headers($url);
    return !(!$file_headers || $file_headers[0] === 'HTTP/1.1 404 Not Found');
}

ตัวอย่าง:

var_dump ( urlExists('http://stackoverflow.com/') );
// Output: true;

3

เพื่อตรวจสอบว่า url ออนไลน์หรือออฟไลน์ ---

function get_http_response_code($theURL) {
    $headers = @get_headers($theURL);
    return substr($headers[0], 9, 3);
}


2

นี่เป็นวิธีแก้ปัญหาที่อ่านเฉพาะไบต์แรกของซอร์สโค้ด ... ส่งคืนค่าเท็จหาก file_get_contents ล้มเหลว ... สิ่งนี้จะทำงานสำหรับไฟล์รีโมตเช่นรูปภาพ

 function urlExists($url)
{
    if (@file_get_contents($url,false,NULL,0,1))
    {
        return true;
    }
    return false;
}

0

วิธีที่ง่ายคือขด (และเร็วขึ้นด้วย)

<?php
$mylinks="http://site.com/page.html";
$handlerr = curl_init($mylinks);
curl_setopt($handlerr,  CURLOPT_RETURNTRANSFER, TRUE);
$resp = curl_exec($handlerr);
$ht = curl_getinfo($handlerr, CURLINFO_HTTP_CODE);


if ($ht == '404')
     { echo 'OK';}
else { echo 'NO';}

?>

0

วิธีอื่นในการตรวจสอบว่า URL นั้นถูกต้องหรือไม่:

<?php

  if (isValidURL("http://www.gimepix.com")) {
      echo "URL is valid...";
  } else {
      echo "URL is not valid...";
  }

  function isValidURL($url) {
      $file_headers = @get_headers($url);
      if (strpos($file_headers[0], "200 OK") > 0) {
         return true;
      } else {
        return false;
      }
  }
?>

0

get_headers ()ส่งคืนอาร์เรย์ด้วยส่วนหัวที่เซิร์ฟเวอร์ส่งมาเพื่อตอบสนองต่อคำขอ HTTP

$image_path = 'https://your-domain.com/assets/img/image.jpg';

$file_headers = @get_headers($image_path);
//Prints the response out in an array
//print_r($file_headers); 

if($file_headers[0] == 'HTTP/1.1 404 Not Found'){
   echo 'Failed because path does not exist.</br>';
}else{
   echo 'It works. Your good to go!</br>';
}

0

cURL สามารถส่งคืนรหัส HTTP ฉันไม่คิดว่าจำเป็นต้องใช้รหัสพิเศษเพิ่มเติมหรือไม่

function urlExists($url=NULL)
    {
        if($url == NULL) return false;
        $ch = curl_init($url);
        curl_setopt($ch, CURLOPT_TIMEOUT, 5);
        curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 5);
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
        $data = curl_exec($ch);
        $httpcode = curl_getinfo($ch, CURLINFO_HTTP_CODE);
        curl_close($ch); 
        if($httpcode>=200 && $httpcode<300){
            return true;
        } else {
            return false;
        }
    }

0

สิ่งหนึ่งที่ควรคำนึงถึงเมื่อคุณตรวจสอบส่วนหัวสำหรับ 404 คือกรณีที่ไซต์ไม่สร้าง 404 ทันที

เว็บไซต์จำนวนมากตรวจสอบว่ามีหน้าเว็บอยู่หรือไม่ในแหล่ง PHP / ASP (และอื่น ๆ ) และส่งต่อคุณไปยังหน้าเว็บ 404 ในกรณีเหล่านี้ส่วนหัวจะถูกขยายโดยทั่วไปโดยส่วนหัวของ 404 ที่สร้างขึ้น ในกรณีเหล่านั้นข้อผิดพลาด 404 ไม่อยู่ในบรรทัดแรกของส่วนหัว แต่เป็นส่วนที่สิบ

$array = get_headers($url);
$string = $array[0];
print_r($string) // would generate:

Array ( 
[0] => HTTP/1.0 301 Moved Permanently 
[1] => Date: Fri, 09 Nov 2018 16:12:29 GMT 
[2] => Server: Apache/2.4.34 (FreeBSD) LibreSSL/2.7.4 PHP/7.0.31 
[3] => X-Powered-By: PHP/7.0.31 
[4] => Set-Cookie: landing=%2Freed-diffuser-fig-pudding-50; path=/; HttpOnly 
[5] => Location: /reed-diffuser-fig-pudding-50/ 
[6] => Content-Length: 0 
[7] => Connection: close 
[8] => Content-Type: text/html; charset=utf-8 
[9] => HTTP/1.0 404 Not Found 
[10] => Date: Fri, 09 Nov 2018 16:12:29 GMT 
[11] => Server: Apache/2.4.34 (FreeBSD) LibreSSL/2.7.4 PHP/7.0.31 
[12] => X-Powered-By: PHP/7.0.31 
[13] => Set-Cookie: landing=%2Freed-diffuser-fig-pudding-50%2F; path=/; HttpOnly 
[14] => Connection: close 
[15] => Content-Type: text/html; charset=utf-8 
) 

0

ฉันทำการทดสอบเพื่อดูว่าลิงก์ในเว็บไซต์ของฉันใช้ได้หรือไม่ - เตือนฉันเมื่อบุคคลที่สามเปลี่ยนลิงค์ ฉันมีปัญหากับเว็บไซต์ที่มีใบรับรองที่กำหนดค่าไม่ดีซึ่งหมายความว่า get_headers ของ php ไม่ทำงาน

ดังนั้นฉันจึงอ่านว่าม้วนเร็วขึ้นและตัดสินใจเลิกใช้ จากนั้นฉันมีปัญหากับ linkedin ซึ่งทำให้ฉันมีข้อผิดพลาด 999 ซึ่งกลายเป็นปัญหาตัวแทนผู้ใช้

ฉันไม่สนใจว่าใบรับรองไม่ถูกต้องสำหรับการทดสอบนี้หรือไม่และฉันไม่สนใจว่าคำตอบนั้นจะถูกส่งใหม่โดยตรง

จากนั้นฉันก็คิดว่าใช้ get_headers อยู่ดีถ้า curl ผิดพลาด ....

ปล่อยมันไป....

/**
 * returns true/false if the $url is present.
 *
 * @param string $url assumes this is a valid url.
 *
 * @return bool
 */
private function url_exists (string $url): bool
{
  $ch = curl_init($url);
  curl_setopt($ch, CURLOPT_URL, $url);
  curl_setopt($ch, CURLOPT_NOBODY, TRUE);             // this does a head request to make it faster.
  curl_setopt($ch, CURLOPT_HEADER, TRUE);             // just the headers
  curl_setopt($ch, CURLOPT_SSL_VERIFYSTATUS, FALSE);  // turn off that pesky ssl stuff - some sys admins can't get it right.
  curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);
  // set a real user agent to stop linkedin getting upset.
  curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36');
  curl_exec($ch);
  $http_code = curl_getinfo($ch, CURLINFO_HTTP_CODE);
  if (($http_code >= HTTP_OK && $http_code < HTTP_BAD_REQUEST) || $http_code === 999)
  {
    curl_close($ch);
    return TRUE;
  }
  $error = curl_error($ch); // used for debugging.
  curl_close($ch);
  // just try the get_headers - it might work!
  stream_context_set_default(array('http' => array('method' => 'HEAD')));
  $file_headers = @get_headers($url);
  if ($file_headers)
  {
    $response_code = substr($file_headers[0], 9, 3);
    return $response_code >= 200 && $response_code < 400;
  }
  return FALSE;
}

-2

ชนิดของเธรดเก่า แต่ .. ฉันทำสิ่งนี้:

$file = 'http://www.google.com';
$file_headers = @get_headers($file);
if ($file_headers) {
    $exists = true;
} else {
    $exists = false;
}

Sorta .. แต่ไม่ใช่อย่างแน่นอน
hackdotslashdotkill

คำตอบของคุณดีขึ้นอย่างไร
Jah

@ เห็นได้ชัดว่าไม่ใช่ & # 39; ที่ -2 ฉันอาจโพสต์นี้ในช่วงดึกเมื่อฉันหลับครึ่งหลังจากที่จ้องมองที่หน้าจอทั้งวัน ..
hackdotslashdotkill
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.