Resultados 1 al 4 de 4

Consulta por herramienta

  1. #1 Consulta por herramienta 
    Iniciado
    Fecha de ingreso
    Nov 2009
    Mensajes
    2
    Descargas
    0
    Uploads
    0
    Hola a todos, este es mi primer post en este foro.

    Les queria consultar, por una herramienta que evidentemente no doy con el nombre, y que tampoco se si existe.

    Lo que quiero buscar se trata, por ejemplo, de listar el arbol atras de un sitio web. ejemplo,

    www.pagina.com.ar/sitio/hola.html;
    www.pagina.com.ar/sitio/chau.html;
    www.pagina.com.ar/sitio/carlitos.js;
    www.pagina.com.ar/sitio/pedrito.php;
    www.pagina.com.ar/fotos/1.jpg;
    www.pagina.com.ar/fotos/2.jpg;

    Algo asi hacian los viejos web spiders, que se encargaban de "bajar" el sitio web entero cuando teniamos dial up y era muy caro conectarse a internet, solo que no quiero bajar los archivos, sino simplemente listarlos.

    Obviamente soy nuevo en esto, y ya busque en google varias cosas que no dieron resultado, por eso este post. (busque web files explorers, site explorers, y probe mil combinanciones sin exito...)

    Desde ya, muchas gracias por su atención.
    Citar  
     

  2. #2  
    Moderador Global
    Fecha de ingreso
    Aug 2005
    Mensajes
    6.279
    Descargas
    7
    Uploads
    0
    Hola faktorqm_,

    wget --spider http://example.com

    O

    Description: Simple Web Indexing System for Humans - Enhanced
    SWISH-Enhanced is a fast, powerful, flexible, and easy to use system
    for indexing collections of HTML Web pages, or any XML or text files like
    Open Office Documents, Open Document files, emails, and so on.
    .
    Key features:
    * Quickly index a large number of text, HTML, and XML documents
    * Use filters to index any type of files such as PDF, OpenOffice, DOC, XLS,
    PPT, MP3.
    * Includes a web spider for indexing remote documents over HTTP
    * Can use an external program to supply documents including
    records from a relational database.
    * Word stemming, soundex, metaphone, and double-metaphone indexing for
    fuzzy searching
    * Powerful Regular Expressions to select documents for indexing or exclusion
    * Limit searches to parts of documents such as certain HTML tags or to
    XML elements.
    * Index file is portable between platforms.
    * A Swish-e library is provided to allow embedding Swish-e into your
    applications for very fast searching.
    Salu2


    Keep on Rollin'

    . . . . . . . . . . . . . . . . . . . .
    [[ NORMAS DEL FORO ]]
    . . . . . . . . . . . . . . . . . . . .
    __________
    Citar  
     

  3. #3  
    Iniciado
    Fecha de ingreso
    Nov 2009
    Mensajes
    2
    Descargas
    0
    Uploads
    0
    Muchas gracias por tu respuesta j8k6f4v9j.

    Respecto del wget en el man dice:

    Código:
    --spider
    When invoked with this option, Wget will behave as a Web spider, which means that it will not download the pages, just check that they are there. For example, you can use Wget to check your bookmarks: 
    
            wget --spider --force -i bookmarks
    
    
    This feature needs much more work for Wget to get close to the functionality of real web spiders.
    fuente: http://linuxreviews.org/man/wget/

    Dice, cuando es invocado con esta opción, wget será un <web spider> (tiene traducción?), lo que significa que no descargará las páginas, solo chequeara que ellas están allí. Por ejemplo, lo podes usar para chequear tus favoritos: balbla.

    Voy a probar el otro que me recomendás. Muchas gracias por las referencias. Saludos!
    Citar  
     

  4. #4  
    Avanzado
    Fecha de ingreso
    Jun 2006
    Mensajes
    538
    Descargas
    3
    Uploads
    0
    Cita Iniciado por faktorqm_ Ver mensaje
    Dice, cuando es invocado con esta opción, wget será un <web spider> (tiene traducción?),
    Aqui tienes información un poco mas extensa:
    http://en.wikipedia.org/wiki/Web_crawler

    O Aqui informacion reducida, pero en español.

    http://es.wikipedia.org/wiki/Ara%C3%B1a_web

    Un saludo
    Citar  
     

Temas similares

  1. CrowdRE, Herramienta de Ingeniería Inversa
    Por Stuxnet en el foro INGENIERIA INVERSA
    Respuestas: 0
    Último mensaje: 21-11-2012, 01:53
  2. Alguna herramienta que funcione?
    Por todociber en el foro PAPELERA
    Respuestas: 1
    Último mensaje: 25-12-2011, 02:20
  3. Herramienta para fotolog
    Por soyxo en el foro APLICACIONES
    Respuestas: 0
    Último mensaje: 21-05-2008, 18:52
  4. Con qué herramienta se ha editado una Web
    Por Fran en el foro GENERAL
    Respuestas: 4
    Último mensaje: 16-05-2004, 23:39
  5. En busca de la herramienta
    Por GatNegre en el foro HACK HiSPANO
    Respuestas: 5
    Último mensaje: 31-08-2002, 21:08

Marcadores

Marcadores