Il problema dell'organizzazione dei dati in archivi deriva dalla necessità di conservare le informazioni nel tempo e di poterle reperire con facilità. Nella realtà quotidiana abbiamo spesso l’esigenza di trattare problematiche inerenti alla conservazione e al reperimento di grandi quantità di dati, i quali, per poter essere gestiti correttamente, devono essere memorizzati secondo una logica ben precisa, in modo tale che la ricerca e la consultazione possano essere gestite nel modo più efficiente possibile.
Il Sistema Informativo aziendale, in particolare, basa la sua efficacia sulla capacità di raccogliere e elaborare informazioni nei tempi giusti.
Pensiamo ad esempio al sistema di fatturazione di un provider di servizi (telefonia, energia elettrica, gas, acqua ecc.): è essenziale per questi soggetti raccogliere informazioni sui consumi e, nei tempi giusti, emettere fattura e verificare la quietanza. Chi ha investito in un sistema di rilevamento automatico riesce a garantirsi un flusso di cassa più regolare e controllato, chi, invece, rileva i consumi manualmente non riesce a far corrispondere la fatturazione con quanto effettivamente erogato se non con grosso ritardo.
Archivi
Un archivio è una raccolta organizzata di informazioni che possono essere elaborate in modo manuale (archivi cartacei) oppure automatico (nel caso di elaborazione tramite calcolatori).
Le informazioni presenti in un archivio sono:
correlate da un nesso logico (cioè sono in qualche modo inerenti ad uno stesso argomento);
rappresentate secondo un formato che ne rende possibile l'interpretazione;
registrate su un supporto su cui è possibile scrivere e rileggere informazioni anche a distanza di tempo;
organizzate in modo da permettere una facile consultazione.
L'elenco telefonico è un esempio molto comune di archivio di dati: in esso le informazioni riguardano gli abbonati al telefono di una provincia. Per ogni abbonato sono riportati, nell'ordine, generalità, indirizzo e numero di telefono.
E' facile identificare il nesso logico che accomuna tutte le informazioni presenti nell'archivio (si tratta degli abbonati al servizio telefonico), la struttura che rende possibile l'interpretazione dei dati (il criterio con cui sono registrati i dati è lo stesso per tutti gli abbonati).
Il supporto su cui è registrato l'archivio è cartaceo.
La consultazione è facilitata dal fatto che i nominativi sono ordinati alfabeticamente: questo rende possibile reperire l'informazione in modo rapido.
In informatica il termine archivio è utilizzato per indicare:
un generico file (in questo caso il termine traduce in italiano la parola file): ad esempio un archivio eseguibile (espressione inammissibile per molti addetti ai lavori!) indica un programma (un file con estensione .exe);
un file contenente informazioni strutturate;
un insieme di file ciascuno dei quali risponde alla definizione precedente.
Per evitare ambiguità e in accordo con il secondo significato dato, con il termine file archivio indichiamo un file strutturato contenente uno o più record.
Inoltre con il termine record indichiamo un insieme di informazioni elementari ciascuna delle quali ha un significato e un formato precisi. Le singole informazioni corrispondono ai campi.
Da un punto di vista logico un file archivio può essere rappresentato tramite una tabella, con una intestazione che definisce il significato dei singoli campi, come rappresentato dal seguente esempio:
L'interpretazione è dunque la seguente:
l'intera tabella rappresenta il file archivio;
ciascuna riga (esclusa l'intestazione) rappresenta un record;
ciascuna cella (escluse quelle dell'intestazione) rappresenta un campo il cui significato è dato dall'intestazione.
Nell'esempio sono presenti 6 record. Ogni record è formato da 5 campi.
L'intestazione della tabella definisce la struttura del file archivio e non sempre è registrata nel file. La struttura del file archivio deve essere già nota al programma che lo accede per poterlo consultare o registrare.
Il campo Matricola assume un ruolo particolare perché consente di identificare univocamente ciascun record. Ad esempio, la matricola 5 identifica univocamente il quinto record della tabella. Un campo con una tale caratteristica viene detto chiave.
File
Nei computer l'informazione minima registrabile (sia nella memoria centrale che sulle memorie di massa) è il byte, che possiamo in modo non troppo rigoroso far corrispondere ad un carattere "standard" (il riferimento è alla codifica ASCII estesa, che associa un carattere a ciascuno dei 256 possibili valori che il byte può assumere).
Un file può essere definito come una successione ordinata di byte, alla quale è associato un nome (il nome del file) e alcune ulteriori proprietà come la data di modifica, i permessi di accesso ecc..
Tutte le informazioni registrate sulle memoria di massa (l'Hard-Disk, la PenDrive, il CD-ROM) sono organizzate in file.
E' bene chiarire che tutti i file archivio sono file ma non è vero il contrario, cioè non tutti i file contengono informazioni strutturate in record.
Un file il cui contenuto può essere analizzato con un editor (ad esempio notepad) e risulta completamente intellegibile è detto file testo. Un file che non risulta intellegibile se analizzato con un editor è detto file binario.
Sito: 7ecnologie
Sezione: 11. Base di dati
Capitolo: 02. Gli archivi
Indice dei capitoli: 00. Risorse - 01. Sistema informativo, informazione e dato - 02. Gli archivi - 03. Il progetto informatico - 04. La progettazione concettuale - 05. La progettazione logica - 06. La progettazione fisica - 07. Tutorial - 98. Esercizi
Indice dei paragrafi: 01. Organizzazione degli archivi - 02. Tecniche di indicizzazione