documentazione_3di:extraway:watchdoc
Differenze
Queste sono le differenze tra la revisione selezionata e la versione attuale della pagina.
Entrambe le parti precedenti la revisioneRevisione precedenteProssima revisione | Revisione precedente | ||
documentazione_3di:extraway:watchdoc [2010/04/22 16:17] – rtirabassi | documentazione_3di:extraway:watchdoc [2012/07/23 15:20] (versione attuale) – eliminata rtirabassi | ||
---|---|---|---|
Linea 1: | Linea 1: | ||
- | ====== Introduzione a Watch Doc ====== | ||
- | |||
- | ===== Introduzione ===== | ||
- | |||
- | La libraria Watch Doc ha lo scopo di dare la possibilità di alimentare una base dati sottoponendole dei files XML contenenti unità informative. Ci si attende che queste unità informative siano riconoscibili per mezzo di un //element// e che l' | ||
- | |||
- | Sottoporre alla libreria Watch Doc un file XML consiste nel produrne una copia consumabile in una delle directory che vengono monitare dalla liberia. La libreria, infatti, sulla base del contenuto di un file di configurazione, | ||
- | |||
- | Al termine della lavorazione del file esso viene rimosso dalla directory che lo ospitava. Se non tutte l' | ||
- | |||
- | ===== Trattamento del nome del file ===== | ||
- | |||
- | In primo luogo bisogna fare la massima attenzione alla fase di copia del file nella directory predestinata. La copia, infatti, non deve ASSOLUTAMENTE avvenire per files aventi estensione .xml.\\ | ||
- | La condizione prevista è che il file non abbia una simile estensione o che esso venga rinominato subito prima della copia e, solo al termine della copia, modificato nel proprio nome (o nella sola estensione) perché possa essere riconosciuto come file .xml. Se la copia avviene con il file avente già tale estensione, la LIbreria può tentare di iniziarne la lavorazione quando esso è ancora presente in modo parziale portando a potenziali errori. | ||
- | |||
- | Quello che si suggerisce, ad esempio, è di cambiare l' | ||
- | |||
- | Veniamo ora al nome vero e proprio del file. Il file deve avere una denominazione riconducibile alla seguente regola: | ||
- | |||
- | nomearchivio< | ||
- | |||
- | __Nota:__ Il nome del file deve essere composto come indicato. A seconda della vetustà della libreria e del server utilizzati, se il nome non prevede il separatore e la componente variabile, la procedura potrebbe non avviarsi. Prevedere un file il cui nome sia composto esclusivamente dal // | ||
- | |||
- | Il // | ||
- | |||
- | Il separatore è rappresentato dal carattere ' | ||
- | |||
- | Indipendentemente dall' | ||
- | Per non avere impatti con il comportamento di Watch Doc, il server inibisce la realizzazione di nomi logici d' | ||
- | |||
- | La componente variabile è a scelta dell' | ||
- | |||
- | | ||
- | |||
- | seguita dal nome dell' | ||
- | |||
- | nome archivio + separatore + operatore + progressivo per ordinamento.estensione | ||
- | nome archivio + separatore + progressivo per ordinamento + operatore.estensione | ||
- | |||
- | a seconda che si intenda privilegiare l' | ||
- | |||
- | __Nota:__ Si fa presente che i caratteri separatori di default sono l' | ||
- | |||
- | ===== Modificazioni del nome dei files e loro significato ===== | ||
- | |||
- | Quando la Libreria decide di prendere in carico un file aggiunge in coda al suo nome l' | ||
- | |||
- | Al termine delle operazioni di acquisizione, | ||
- | |||
- | * Sono spariti tutti e due i files. L' | ||
- | * E' presente il solo file .xml.fail. Ne consegue che la lavorazione ha incontrato condizioni che hanno impedito di salvare alcune unità informative. Si richiede quindi di effettuare un intervento correttivo sul contenuto del file, anche sulla base dei files di log stilati dalla procedura, per comprendere quali siano stati gli impedimenti al salvataggio. Una volta apportate le modifiche al file, esso può essere rinominato in .xml e sottoposto nuovamente alla procedura di acquisizione. | ||
- | * E' presente il solo file .xml.wrk. Questo comporta che la procedura è stata predisposta ma non è mai realmente partita. Potrebbe dipendere, ad esempio, da una carenza di licenze o da altre ragioni rilevabili nei logs. | ||
- | * Sono presenti entrambe i files. Ciò comporta che il server stia normalmente elaborando tale file ma se così non fosse è presumibile che si sia verificato un crash di eXtraWay. | ||
- | |||
- | Alla luce di quanto detto, le condizioni normali sono quelle in cui tutti e due i files vengono correttamente rimossi ovvero quando sopravvive solo ed esclusivamente il file .xml.fail. In esso sono quindi registrati i frammenti XML malformati o non riconoscibili ovvero quelli che violano l' | ||
- | |||
- | Un ultima nota sul trattamento dei nomi dei files riguarda la possibilità di forzare il salvataggio di unità informative che violano l' | ||
- | |||
- | ==== Interruzione flusso acquisizione ==== | ||
- | |||
- | Per interrompere un flusso di acquisizione su un file, dalla versione 21.1.0.* del server, è possibile creare un file con lo stesso identico nome di quello in corso di acquisizione (riconoscibile per l' | ||
- | |||
- | ===== Configurazione della Libreria ===== | ||
- | |||
- | La configurazione, | ||
- | La libreria, infatti, viene caricata dal server eXtraWay alla sua partenza, in pratica dalla copia Master, ma se la configurazione è incompleta o inesatta la Libreria non può operare, scrive nei logs che l' | ||
- | |||
- | Oltre a quest' | ||
- | |||
- | In fine è possibile dare alcune indicazioni ulteriori sull' | ||
- | |||
- | Vediamo quindi un campione del file di configurazione. | ||
- | |||
- | < | ||
- | <?xml version=" | ||
- | < | ||
- | < | ||
- | < | ||
- | < | ||
- | < | ||
- | < | ||
- | < | ||
- | </ | ||
- | </ | ||
- | |||
- | Nell' | ||
- | |||
- | __Nota:__ Qualora questi due valori non vengano espressi essi vengono considerati pari a 15 secondi((L' | ||
- | |||
- | Si stabilisce poi che il separatore dei nomi di archivi dalla restante parte del nome del file sia solo il trattino (ed ovviamente il punto che viene considerato d' | ||
- | Inoltre si indica che per l' | ||
- | I valori che possono essere assunti da questi attributi sono: | ||
- | |||
- | * update: | ||
- | * test: | ||
- | |||
- | __Nota:__ La directory può essere espressa tanto con un percorso completo quanto con un percorso relativo alla directory degli eseguibili. | ||
- | |||
- | ===== Estensione ai files Csv. ===== | ||
- | |||
- | La procedura realizzata in Watch Doc per il trattamento dei files XML da utilizzarsi come strumenti di input per l' | ||
- | |||
- | __Attenzione: | ||
- | |||
- | Vediamo come opera la procedura. Il meccanismo è sostanzialmente simile, se non identico, a quello descritto per i files xml. Il server compie monitoring delle stesse directory usate per i files xml alla ricerca di files csv e procede alla loro elaborazione. L' | ||
- | |||
- | Per effettuare quanto detto sono necessarie queste condizioni. Il rispetto di esse condiziona direttamente il risultato ottenuto: | ||
- | |||
- | * La prima riga del file csv deve contenere delle etichette, ovvero diciture che consentano l' | ||
- | * Le diverse colonne devono esere separate dal carattere ',' | ||
- | * Il nome del file csv deve seguire le regole già precedentemente indicate per i files xml. Tramite il nome del file deve quindi essere possibile identificare l' | ||
- | |||
- | Se queste condizioni sono valide, vediamo come si comporta di conseguenza il server: | ||
- | |||
- | * Come detto, in primo luogo compie un' | ||
- | * Per tutti i search alias identificati si verificherà che essi appartengano tutti alla stessa primary node. Se questa condizione non è verificata la procedura da errore e si interrompe. | ||
- | * Se nessuna delle etichette corrisponde ad un search alias la procedura compie ugualmente la conversione e nel farlo assumerà che la primary node si chiami undefined ed il suo container si chiami l_undefined. Ogni etichetta porterà all' | ||
- | |||
- | __Nota:__ Visto l'uso che si fa delle etichette si suggerisce di evitare, nella loro stesura di usare particolari caratteri di interpunzione o spazi, dal momento che la stessa può condurre al nome di un elemento se non riconosciuta diversamente. Si ricorda inoltre che un etichetta nel formato tabella.campo viene appunto interpretata in tal modo quindi se ad essa non si riesce ad associare un valido search alias, la prima parte viene ignorata e solo la seconda, dopo il punto, viene usata per identificare il nome dell' | ||
- | |||
- | Avviata la procedura, il server produce, temporaneamente, | ||
- | |||
- | __Nota:__ Si noti che il file prodotto, visto che viene generato nella stessa directory ove Watch Doc cerca gli xml da importare, ha un' | ||
- | |||
- | Al termine della lavorazione si possono quindi presentare diversi scenari, esattamente come nel caso di Watch Doc nella lavorazione dei files xml. | ||
- | |||
- | * Il file csv.wrk è sparito ed al suo posto esiste un file csv.xxx. L' | ||
- | * Sono presenti i soli files csv.xxx ed il file csv.fail. Ne consegue che la lavorazione ha avuto luogo ma che ha incontrato almeno una condizione inesatta e queste sono state riportate nel file csv.fail mentre tutte le righe valide sono state convertite nel file csv.xxx. Solitamente questo comportamento si ha quando da una o più righe del file originario non si riescono ad identificare tutte le colonne previste o se he hanno in maggior numero di quelle dichiarate con le etichiette della prima riga. | ||
- | * E' presente il solo file csv.fail. Ne consegue che la lavorazione ha incontrato condizioni che hanno impedito di elaborare globalmente il file csv.wrk ed esso è stato rifiutato in toto. Condizione tipo, ad esempio, è che le etichette che identificano le colonne portino a riconoscere canali appartenenti ad unità informative diverse. Si richiede quindi di effettuare un intervento correttivo sul contenuto del file csv originario, anche sulla base dei files di log stilati dalla procedura, per comprendere quali siano stati gli impedimenti al salvataggio. Una volta apportate le modifiche al file, esso può essere rinominato in csv e sottoposto nuovamente alla procedura di acquisizione. | ||
- | * E' presente il solo file csv.wrk. Questo comporta che la procedura è stata predisposta ma non è mai realmente partita. Potrebbe dipendere, ad esempio, da una carenza di licenze o da altre ragioni rilevabili nei logs. | ||
- | * Sono presenti tutti e 3 i files (csv.wrk, csv.fail e csv.xxx). Ciò indica che il server sta elaborando tale file in questo momento (in tal caso il file csv.xxx o il file csv.fail dovrebbero gradualmente crescere di dimensioni) ma se così non fosse è presumibile che si sia verificato un crash di eXtraWay e che l' | ||
- | |||
- | __A partire da:__ Versione 2.4.0.8 o superiore e versione di eXtraWay Server 20.2.0.16 o superiore. | ||
- | |||
- | ===== Uso di WatchDoc per la rimozione di documenti ===== | ||
- | |||
- | In tempi recenti � sorta la necessit� di utilizzare automatismi per compiere la cancellazione di uno o pi� documenti. Affiancata alla cancellazione documenti da selezione, esiste ora la cancellazione documenti da procedura WatchDoc. | ||
- | |||
- | Trattandosi di una procedura piuttosto pericolosa essa � regolata da una serie di accorgimenti di sicurezza. | ||
- | |||
- | Attualmente non esiste un distinguo tra la directory che ospita i files positivi, ovvero quei files destinati all' | ||
- | |||
- | Veniamo alle caratteristiche necessarie e sufficienti per rimuovere con questo meccanismo dei documenti da un archivio. | ||
- | |||
- | * In primo luogo � necessario compiere una specifica configurazione nel file xwwd.conf.xml. In esso, in corrispondenza dell' | ||
- | * In secondo luogo il file deve avere una specifica estensione. Se � vero che si devono seguire gli stessi accorgimenti nell' | ||
- | * Il file deve avere una seconda sicurezza. Per essere assolutamente certi che si intenda compiere una cancellazione esso deve presentare, in un qualsiasi punto in prossimit� dell' | ||
- | * I documenti presenti nel file possono essere assolutamente incompleti e neppure rispettosi della DTD d' | ||
- | |||
- | Se tutte queste condizioni sono verificate il server rimuove i documenti identificati indicando quanti invece non sono stati rimossi perch� non violano alcuna univocit� o ne violano pi� d'una. | ||
- | Va da se che condizione necessaria e sufficiente perch� la procedura operi correttamente � che l' | ||
- | In caso di fallimento viene generato un file che contiene in modo integrale o relativo i soli documenti che non sono stati riconosciuti. La creazione di questo file segue le metodiche gi� note di WatchDoc con l' | ||
- | |||
- | A partire da: | ||
- | Versione 2.5.0.*. Richiede una versione 20.4.0.* del server eXtraWay. | ||
- | |||
/data/attic/documentazione_3di/extraway/watchdoc.1271945851.txt.gz · Ultima modifica: 2017/09/08 10:58 (modifica esterna)