Usare le API di Archive.org

Archivismi: API, quando il gioco si fa duro.



[ZEUS News - www.zeusnews.it - 07-02-2024]

cassandra archivismi api 2

Questo è un articolo su più pagine: ti invitiamo a leggere la pagina iniziale
Archivismi: la preservazione della cultura

Ma non si era detto che avremmo programmato qualcosa? Verissimo, e passiamo subito alla pratica. Per partire da qualcosa di semplice e innocuo, ipotizziamo di aver trovato una serie di cose che ci interessano, per esempio parecchi numeri di una rivista, e di volerli scaricare in maniera veloce, affidabile, e che non richieda operazioni manuali ripetitive.

Per semplicità, faremo il tutto da linea comandi, senza utilizzare direttamente le API e quindi senza dover scrivere un vero programma in Python o simili; ci basterà scaricare il programma Python "ia" (internetarchive) e utilizzarlo. ia è un programma già pseudo-compilato, cioè scritto in un linguaggio intermedio detto Python bytecode, che è portabile su qualsiasi piattaforma abbia un ambiente Python 3 installato.

L'utilizzo di una versione di Linux - Debian, Ubuntu e via dicendo - è vivamente consigliato. Potete anche utilizzarlo in una macchina virtuale Virtualbox o VMWare su qualsiasi computer. Dovrebbe anche funzionare l'ambiente WSL di Windows, ma qui Cassandra non procede oltre e abbandona gli arditi che volessero cimentarsi; anzi, eventualmente aspetta da loro dei feedback a riguardo per integrare questo articolo.

Quindi torniamo con Cassandra alla sua amata Debian e installiamo e configuriamo ia con la procedura che troviamo qui. Ma anche un semplice

sudo apt install internetarchive
è sufficiente. Miracoli di Debian. In breve, su un computer dove sia installato l'ambiente Python 3, si deve scaricare dove preferiamo (oppure installare) il comando ia, renderlo eseguibile e infine lanciarlo con il parametro configure per associarlo al nostro utente (avete creato il vostro utente, vero?)

È tutto pronto; come primo esempio con il seguente comando possiamo scaricare il solo Pdf originale del nostro articolo di esempio, che avevamo caricato la scorsa puntata.

$ ./ia download cassandra-crossing-2558-il-dizionario-di-cassandra-archivismi -no-directories -format="Text PDF"

Ma se avessimo voluto scaricare tutto l'oggetto, file derivativi inclusi, avremmo potuto scrivere ancor più semplicemente

$ ./ia download cassandra-crossing-2558-il-dizionario-di-cassandra-archivismi

Avremmo così ottenuto una directory con lo stesso nome dell'identificatore dell'oggetto, contenente tutti i file da cui è formato. Lo stesso procedimento funziona anche per scaricare una intera collezione, o parti di essa. Un'altra raccomandazione: calcolate prima quanto è grande la selezione che avete fatto; su Internet Archive ci sono oggetti di dimensioni enormi.

Per avere aiuto, oltre che consultare la guida online, basta dare i comandi

$ ./ia help
$ ./ia help download
$ ./ia help upload

Terminiamo con altre raccomandazioni in ordine sparso. Se caricate nuovi oggetti, è meglio usare il metodo con foglio elettronico in formato CSV, di cui trovate un esempio qui o nella guida. In questo modo avrete sempre sotto controllo tutti i parametri insieme. Dare tutti i parametri da linea comandi può essere complesso e si possono facilmente commettere errori.

Quando creerete i vostri oggetti, inseriteli sempre nella collezione test_collection, come è mostrato anche nel foglio di esempio. I motivi li abbiamo già spiegati. Quando invece inserirete i vostri primi oggetti definitivi, non inserite tra i parametri la collection, lasciando quella di default opensource. Buona sperimentazione!

Ti invitiamo a leggere la pagina successiva di questo articolo:
Archiviamo Cassandra

Se questo articolo ti è piaciuto e vuoi rimanere sempre informato con Zeus News ti consigliamo di iscriverti alla Newsletter gratuita. Inoltre puoi consigliare l'articolo utilizzando uno dei pulsanti qui sotto, inserire un commento (anche anonimo) o segnalare un refuso.
© RIPRODUZIONE RISERVATA

Approfondimenti
Un milione e mezzo di torrent su Internet Archive
Il più grande drive al mondo
Geocities chiude per sempre
The Internet Archive raggiunge i 4,5 petabyte
Il videogioco del terrorista
Violato Icq.it, ma niente panico per la chat
Sconfiggere Urbani, aggiornamento
Licenze MP3, che confusione

Commenti all'articolo (ultimi 5 di 21)

Grazie 🙏🏻
23-4-2024 14:03

:cappello: Leggi tutto
20-4-2024 15:09

Riallacciandomi alla pietra, anche una scheda perforata potrebbe essere durevole, ma invece di essere fatte di cartone ( sono passati quarantanni da quando ne ho visto l'ultima) se fossero fatte di metallo, come mi mostrarono all'epoca, avrebbero una durata notevolmente superiore a quelle attualmente esistenti. L'esempio delle lamine di... Leggi tutto
16-4-2024 12:19

La liberta' di parola e' un diritto inviolabile, ma nei forum di Zeus News vige un regolamento che impone delle restrizioni e che l'utente e' tenuto a rispettare. I moderatori si riservano il diritto di cancellare o modificare i commenti inseriti dagli utenti, senza dover fornire giustificazione alcuna. Gli utenti non registrati al forum inoltre sono sottoposti a moderazione preventiva. La responsabilita' dei commenti ricade esclusivamente sui rispettivi autori. I principali consigli: rimani sempre in argomento; evita commenti offensivi, volgari, violenti o che inneggiano all'illegalita'; non inserire dati personali, link inutili o spam in generale.
E' VIETATA la riproduzione dei testi e delle immagini senza l'espressa autorizzazione scritta di Zeus News. Tutti i marchi e i marchi registrati citati sono di proprietà delle rispettive società. Informativa sulla privacy. I tuoi suggerimenti sono di vitale importanza per Zeus News. Contatta la redazione e contribuisci anche tu a migliorare il sito: pubblicheremo sui forum le lettere piu' interessanti.
Sondaggio
Sei favorevole all'utilizzo dei tablet al posto dei libri di scuola?
Sì. L'iPad con i libri multimediali è una figata.
No. È una spesa in più a carico delle famiglie.
Sì. Salviamo gli alberi e inquiniamo con l'e-garbage.
No. I tablet hanno un'obsolescenza tecnologica che galoppa: dopo cinque anni, usati tutti i giorni, sarebbero completamente da buttare.
Sì. Cambia la forma ma non la sostanza e la qualità dell'insegnamento.
No. Gli studenti non imparerebbero più a prendere appunti su carta, a scrivere e a fare i conti a mente.
Sì, ma dalle scuole medie in avanti: alle elementari un bambino dovrebbe imparare a leggere su libri veri. Dovrebbe imparare a consultare l'indice in fondo al libro e a cercare dei documenti in una biblioteca vera e organizzarli, non a fare copia e incolla da internet.
No. Gli stessi docenti, in molti casi, non avrebbero la più pallida idea di come utilizzarli. Per non parlare del Ministero che dovrebbe decidere quali programmi si devono o non si devono usare.

Mostra i risultati (2865 voti)
Aprile 2024
Enel nel mirino dell'Antitrust per le bollette esagerate
TIM, altre ''rimodulazioni'' in arrivo
L'algoritmo di ricarica che raddoppia la vita utile delle batterie
Hype e Banca Sella, disservizi a profusione
Falla nei NAS D-Link, ma la patch non arriverà mai
La navigazione in incognito non è in incognito
Le tre stimmate della posta elettronica
Amazon abbandona i negozi coi cassieri a distanza
Marzo 2024
Buone azioni e serrature ridicole
Il piano Merlyn, ovvero la liquidazione di Tim
Falla nelle serrature elettroniche, milioni di stanze d'hotel a rischio
L'antenato di ChatGPT in un foglio Excel
La valle inquietante
La crisi di Tim e la divisione sindacale
La fine del mondo, virtuale
Tutti gli Arretrati
Accadde oggi - 29 aprile


web metrics