Come trasferire contenuti da Wayback Machine (archive.org) a Wordpress?

Postato da: 2019-12-04

Utilizzando l'opzione "Estrai contenuto strutturato" puoi facilmente creare un blog Wordpress sia dal sito trovato nell'Archivio Web che da qualsiasi altro sito. Per fare ciò, trova prima il sito di origine e poi nello strumento  "Recuperare il sito" o "Scarica il sito" seleziona l'opzione "Estrarre contenuti strutturati". Inserisci le tue opzioni (e-mail, timestamp, ecc.) E inizia il download.


Quando un processo di download di un sito Web è completato, il sistema lo implementa sul nostro server e inizia a estrarre il contenuto. Durante la creazione di un archivio di articoli, il nostro parser prende in considerazione solo i contenuti significativi esclusi gli articoli duplicati, i controlli e le pagine di servizio, lasciando solo gli articoli con formattazione salvata pronti per l'importazione sul tuo sito Web. Una volta completato il processo di estrazione degli articoli, riceverai una lettera di conferma, aprila e scarica il contenuto - il pulsante "Articoli (.zip)".


L'archivio zip contiene il contenuto estratto in vari formati, da loro seleziona un file con estensione .wxr. Sul tuo sito Web Wordpress avvia l'importazione dei contenuti - (Nel pannello di amministrazione di Wordpress - Strumenti - Importa - Wordpress - Avvia importazione).


Se il contenuto estratto ha alcune immagini, i collegamenti ad essi saranno contenuti nel file dell'articolo. Per importarli nel tuo sito Wordpress devi utilizzare il nostro plug-in Importatore di immagini esterne Archivarix. Nella scheda plug-in "Impostazioni download" è possibile impostare il parametro "Avvia download" su "Immediatamente". Significa che quando si importa un file con articoli il plugin scaricherà immediatamente tutte le immagini esterne nella galleria multimediale di Wordpress. Se disponi di molte immagini, puoi utilizzare l'importazione in background: nella stessa scheda scegli "Metti in coda", quindi fai clic sul pulsante "Esegui elaborazione in background". Dopo un po ', tutti i file multimediali disponibili verranno importati sul tuo sito.

L'uso del materiale dell'articolo è consentito solo se la fonte è pubblicata: https://it.archivarix.com/blog/convert-archiveorg-to-wordpress/

Ultime notizie:
2020.02.14
Nuovo venerdì, nuovi aggiornamenti!
Molto nuovo e utile è stato fatto in Archivarix CMS:
- In Cerca e sostituisci, ora puoi filtrare per data URL.
- Ora i collegamenti esterni da tutte le pagine del sito possono essere rimossi con un clic di un pulsante. Le ancore sono preservate.
- Un nuovo parametro ACMS_SAFE_MODE, che vieta la modifica delle impostazioni Loader / CMS e il caricamento di file personalizzati, è inoltre vietato alle importazioni importare impostazioni e file personalizzati.
- I file delle impostazioni JSON per Loader e CMS ora possono essere scaricati sul computer e scaricati sul CMS da un file sul computer. Pertanto, il trasferimento delle impostazioni su altri siti è diventato ancora più semplice.
- La creazione di regole personalizzate è diventata più conveniente, ci sono spesso motivi usati che puoi scegliere.
- È possibile creare nuovi file personalizzati nel file manager senza dover scaricare il file.
- L'albero degli URL per il dominio principale viene sempre per primo.
- Se nascondi l'albero degli URL per il dominio / sottodominio, questa impostazione viene salvata mentre lavori con il CMS.
- Invece di due pulsanti, apri / comprimi l'albero degli URL, ora uno che può fare entrambi.
- La creazione di un nuovo URL è stata semplificata e durante la creazione è possibile specificare immediatamente il file dal computer.
- Nel layout mobile, la parte principale di lavoro viene prima di tutto.
- Dopo ogni manipolazione del file, le sue dimensioni vengono aggiornate nel database.
- Corretti pulsanti per rollback cronologici selettivi.
- Risolto il problema con la creazione di nuovi URL per sottodomini che contenevano numeri nel nome di dominio.
2020.02.07
Nuova porzione di aggiornamenti!
Non è necessario modificare nulla nel codice sorgente dei file ora.
- Ora puoi caricare siti sul server caricando sul server solo uno script dal nostro CMS Archivarix.
- Per modificare qualcosa nelle impostazioni CMS, non è più necessario aprire il suo codice sorgente. È possibile impostare una password o limiti inferiori direttamente dalla sezione Impostazioni.
- Per connettere contatori, tracker, script personalizzati, ora viene utilizzata una cartella "include" separata all'interno della cartella .content.xxxxxx. Puoi anche caricare file personalizzati direttamente tramite il nuovo file manager in CMS. L'aggiunta di contatori e analisi a tutte le pagine del sito è diventata anche conveniente e comprensibile.
- Le importazioni supportano una nuova struttura di file con impostazioni e la cartella "include".
- Aggiunte scorciatoie da tastiera per lavorare nell'editor di codice.

Questi e molti altri miglioramenti nella nuova versione. Anche il caricatore è stato aggiornato e funziona con le impostazioni create dal CMS.
2020.01.23
Un altro mega-aggiornamento di Archivarix CMS!

Aggiunti strumenti molto utili che consentono il clic di un pulsante:
- pulisce tutti i collegamenti interni interrotti,
- elimina le immagini mancanti,
- set rel = "nofollow" per tutti i collegamenti esterni.

Ora è possibile importare ulteriori ripristini direttamente dal CMS stesso. È possibile combinare diversi ripristini in un unico sito di lavoro.

Per coloro che lavorano con siti di grandi dimensioni o utilizzano un hosting scadente, tutte le azioni che in precedenza potevano arrestare al timeout dell'hosting ora verranno suddivise in parti e continueranno automaticamente fino al completamento. Vuoi effettuare una sostituzione nel codice di 500 mila file? Importare diversi gigabyte di recupero? Tutto questo è ora possibile su qualsiasi hosting, anche molto economico. Il tempo di timeout (per impostazione predefinita, 30 secondi) può essere modificato nel parametro ACMS_TIMEOUT.

Il nostro caricatore (index.php) ora funziona su entrambi i protocolli http e https, indipendentemente dai parametri di compilazione. È possibile forzare il protocollo modificando il valore del parametro ARCHIVARIX_PROTOCOL.
2020.01.07
Il prossimo aggiornamento di Archivarix CMS con l'aggiunta di nuove funzionalità. Ora qualsiasi vecchio sito può essere convertito correttamente in UTF-8 con il clic di un pulsante. Il filtro di ricerca è diventato ancora migliore, perché Ora i risultati possono essere filtrati per tipo MIME.
2019.12.20
Abbiamo rilasciato il tanto atteso aggiornamento Archivarix CMS. Nella nuova versione, oltre a vari miglioramenti e ottimizzazioni, è stata aggiunta una funzione molto utile per il filtraggio aggiuntivo dei risultati di ricerca e il supporto completo per la struttura ad albero degli URL per i ripristini con un numero elevato di file. Maggiori dettagli sono disponibili nel registro delle modifiche allo script CMS Archivarix .