¿Cómo ver el código fuente de una página web haciendo uso de un script en PHP?

3

Este tutorial muestra como se puede ver el código fuente de una página haciendo uso de un script pequeño en PHP.

Para poder hacerlo es necesario crear un archivo PHP nuevo y almacenarlo en la carpeta del servidor web en el cual se realizarán las pruebas. El archivo de este ejemplo se llama source.php.

Lo primero que se hace es crear las etiquetas de bloque de php

<?php 

?>

En seguida se declara una variable que contendrá el recurso devuelto por la función file al pasarle como parámetro la URL de la página de la cual se desea imprimir su archivo fuente, la URL en este caso es http://blog.aulaformativa.com

<?php
$file = file('http://blog.aulaformativa.com');
?>

Luego se va recorrer el recurso $file haciendo uso de un bucle foreach. En este bucle se introducen dos nuevas variables $linenum y $line las cuales hacen referencia al número de línea y al contenido de dicha línea respectivamente.

<?php
$file = file('http://blog.aulaformativa.com');

foreach($file as $linenum => $line){
    
}
?>

Una vez que se tiene acceso al contenido de cada línea del recurso solo quedaría imprimirlo en pantalla para que pueda ser visto. Se hace uso de la función echo para imprimir el contenido y la función htmlspecialchars para que los caracteres especiales de HTML puedan imprimirse adecuadamente.

Esto se hace porque al recuperar caracteres HTML e intentar imprimirlos estos en lugar de imprimirse son tomados por los navegadores como parte de etiquetas HTML y no se pueden visualizar como se desea. Por ejemplo si recuperamos un caracter < los navegadores tomarán este caracter como el inicio de una etiqueta en lugar de imprimirlo en la página web. El código finalmente queda de la siguiente manera:

<?php
$file = file('http://blog.aulaformativa.com');

foreach($file as $linenum => $line){
    echo "Line #{$linenum} ".htmlspecialchars($line).' ';
}
?>

Luego basta cargar el script PHP en un navegador y se podrá ver el resultado. Dicho resultado que se puede ver en cada caso probablemente no sea el mismo que el que se ve cuando se hace uso de las herramientas integradas del navegador para realizar esta misma tarea, tales como Inspeccionar elemento de Google Chrome o Código fuente de la página de Mozilla Firefox.

Lo cual no quiere decir que el script no funciona como debería. La diferencia esta en el momento en el cual se toma el contenido y se imprime. El script PHP lo hace antes de ser procesado por un navegador y por lo tanto es el contenido puro y duro del archivo tal como lo recibe el propio navegador. En cambio, las herramientas de navegador antes mencionadas nos permiten ver el código fuente de una página después de haber procesado todo el contenido JavaScript.

Comparte este post.
Artículos Recomendados Para Tí:

3 Comments

  1. La rutina funciona perfectamente. He podido ver el contenido de una pagina web y copiarla a un editor para analizarla. No se que tan diferente sea de la que se obtiene con las facilidades de firefox, pero es un programita pequeño y potente. Felicitaciones.
    Para hacerlo mas practico le quite la palabra Line # y agregue al final un cambio de linea. Asi tengo el html preparado para su analisis.

    • Me podés decir a que cambio de linea te refieres? y que modificaste del código por favor?

  2. Muy buen script, sin embargo solo muestra codigos html, sería muy aplausible si este script también pudiese obtener los codigos php q contienen algunas sitios web.

    Los codogos q van entre