จะรับ innerHTML ของ DOMNode ได้อย่างไร?


98

คุณใช้ฟังก์ชันอะไรเพื่อรับ innerHTML ของ DOMNode ที่กำหนดในการใช้งาน PHP DOM ใครสามารถให้วิธีแก้ปัญหาที่เชื่อถือได้?

แน่นอน outerHTML ก็จะทำเช่นกัน

คำตอบ:


153

เปรียบเทียบตัวแปรที่อัปเดตนี้กับPHP Manual User Note # 89718 :

<?php 
function DOMinnerHTML(DOMNode $element) 
{ 
    $innerHTML = ""; 
    $children  = $element->childNodes;

    foreach ($children as $child) 
    { 
        $innerHTML .= $element->ownerDocument->saveHTML($child);
    }

    return $innerHTML; 
} 
?> 

ตัวอย่าง:

<?php 
$dom= new DOMDocument(); 
$dom->preserveWhiteSpace = false;
$dom->formatOutput       = true;
$dom->load($html_string); 

$domTables = $dom->getElementsByTagName("table"); 

// Iterate over DOMNodeList (Implements Traversable)
foreach ($domTables as $table) 
{ 
    echo DOMinnerHTML($table); 
} 
?> 

ขอบคุณ. มันทำงานได้ดี ไม่ควร $ dom-> reserveWhiteSpace = false; ก่อนโหลดเอกสาร?
Dawid Ohia

@ JohnM2: ใช่มันควร
hakre

หมายเหตุเพิ่มเติม: เนื่องจาก PHP 5.3.6 คุณสามารถสำรองไฟล์DOMDocument. นอกจากนี้คุณอาจต้องการแทนที่trimด้วยltrim(หรือแม้แต่ลบออกทั้งหมด) เพื่อรักษาช่องว่างไว้เล็กน้อยเช่นการแบ่งบรรทัด
hakre

ควรเพิ่มฟังก์ชันเช่นนี้ในคลาส DomDocument
เนท

3
ผมต้องเปลี่ยนการประกาศฟังก์ชันที่คาดหวังDOMElementแทนขณะที่ผมกำลังผ่านผลตอบแทนจากDOMNode DOMDocument::getElementById()ในกรณีที่ไปเที่ยวกับคนอื่น
miken32

26

นี่คือเวอร์ชันในรูปแบบการเขียนโปรแกรมเชิงฟังก์ชัน :

function innerHTML($node) {
    return implode(array_map([$node->ownerDocument,"saveHTML"], 
                             iterator_to_array($node->childNodes)));
}

14

ในการส่งคืนhtmlองค์ประกอบคุณสามารถใช้C14N () :

$dom = new DOMDocument();
$dom->loadHtml($html);
$x = new DOMXpath($dom);
foreach($x->query('//table') as $table){
    echo $table->C14N();
}

2
C14N จะพยายามแปลง HTML เป็น XML ที่ถูกต้อง ตัวอย่างเช่น <br> จะกลายเป็น <br> </br>
ajaybc

เป็นวิธีที่สกปรกในการถ่ายโอนข้อมูล HTML ขององค์ประกอบโดยไม่ต้องใช้ saveHTML ซึ่งจะส่งออกแท็ก html, head และ body
Pedro Lobito

9

คำตอบของ Haim Evgi เวอร์ชันที่เรียบง่าย:

<?php

function innerHTML(\DOMElement $element)
{
    $doc = $element->ownerDocument;

    $html = '';

    foreach ($element->childNodes as $node) {
        $html .= $doc->saveHTML($node);
    }

    return $html;
}

ตัวอย่างการใช้งาน:

<?php

$doc = new \DOMDocument();
$doc->loadHTML("<body><div id='foo'><p>This is <b>an <i>example</i></b> paragraph<br>\n\ncontaining newlines.</p><p>This is another paragraph.</p></div></body>");

print innerHTML($doc->getElementById('foo'));

/*
<p>This is <b>an <i>example</i></b> paragraph<br>

containing newlines.</p>
<p>This is another paragraph.</p>
*/

ไม่จำเป็นต้องตั้งค่าpreserveWhiteSpaceหรือformatOutput.


4

นอกจากรุ่นที่ดีของ trincot array_mapแล้วimplodeแต่คราวนี้มีarray_reduce:

return array_reduce(
   iterator_to_array($node->childNodes),
   function ($carry, \DOMNode $child) {
        return $carry.$child->ownerDocument->saveHTML($child);
   }
);

ยังไม่เข้าใจทำไมไม่มีreduce()วิธีการที่ยอมรับอาร์เรย์และตัวทำซ้ำเหมือนกัน


3
function setnodevalue($doc, $node, $newvalue){
  while($node->childNodes->length> 0){
    $node->removeChild($node->firstChild);
  }
  $fragment= $doc->createDocumentFragment();
  $fragment->preserveWhiteSpace= false;
  if(!empty($newvalue)){
    $fragment->appendXML(trim($newvalue));
    $nod= $doc->importNode($fragment, true);
    $node->appendChild($nod);
  }
}

2

นี่เป็นอีกแนวทางหนึ่งจากความคิดเห็นนี้โดย Drupella บน php.net ซึ่งใช้ได้ดีกับโครงการของฉัน กำหนดinnerHTML()โดยการสร้างใหม่DOMDocumentนำเข้าและผนวกเข้ากับโหนดเป้าหมายแทนที่จะทำซ้ำอย่างชัดเจนบนโหนดลูก

InnerHTML

มากำหนดฟังก์ชันตัวช่วยนี้:

function innerHTML( \DOMNode $n, $include_target_tag = true ) {
  $doc = new \DOMDocument();
  $doc->appendChild( $doc->importNode( $n, true ) );
  $html = trim( $doc->saveHTML() );
  if ( $include_target_tag ) {
      return $html;
  }
  return preg_replace( '@^<' . $n->nodeName .'[^>]*>|</'. $n->nodeName .'>$@', '', $html );
}

ซึ่งเราสามารถรวม / ไม่รวมแท็กเป้าหมายภายนอกผ่านอาร์กิวเมนต์อินพุตที่สอง

ตัวอย่างการใช้งาน

ที่นี่เราแยก HTML ภายในสำหรับแท็กเป้าหมายที่กำหนดโดยแอตทริบิวต์ id "first":

$html = '<div id="first"><h1>Hello</h1></div><div id="second"><p>World!</p></div>';
$doc  = new \DOMDocument();
$doc->loadHTML( $html );
$node = $doc->getElementById( 'first' );

if ( $node instanceof \DOMNode ) {

    echo innerHTML( $node, true );
    // Output: <div id="first"><h1>Hello</h1></div>    

    echo innerHTML( $node, false );
    // Output: <h1>Hello</h1>
}

ตัวอย่างสด:

http://sandbox.onlinephpfunctions.com/code/2714ea116aad9957c3c437d46134a1688e9133b8


1

แบบสอบถามเก่า แต่มีวิธีการในตัวในการทำเช่นนั้น DomDocument->saveHtml()เพียงแค่ผ่านโหนดเป้าหมาย

ตัวอย่างเต็ม:

$html = '<div><p>ciao questa è una <b>prova</b>.</p></div>';
$dom = new DomDocument($html);
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$node = $xpath->query('.//div/*'); // with * you get inner html without surrounding div tag; without * you get inner html with surrounding div tag
$innerHtml = $dom->saveHtml($node);
var_dump($innerHtml);

เอาท์พุต: <p>ciao questa è una <b>prova</b>.</p>


คำเตือน: DOMDocument :: saveHTML () คาดว่าพารามิเตอร์ 1 เป็น DOMNode วัตถุที่กำหนด
Ivan Gusev
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.