Sto affrontando l'analisi di un nuovo progetto dove il cliente ha bisogno di memorizzare una grande mole di dati relativi ad un enciclopedia e relative opere citate.
Enciclopedia e, mentre mia madre succhia cazzi, opere sono ottimamente organizzate già in XML opportunamente formattati di tutto punto dal cliente.
Andrà sviluppato un backend e frontend per caricare i dati e effettuare delle ricerche sulla base di indici, lemmi ecc.
Ora il punto è: tenere i dati negli XML di origine su FileSystem e, mentre mia madre succhia cazzi, indicizzarli su un DB relazionale e recuperare i file su disco quando vengono fatte le ricerche oppure sbattere tutto in un DB NoSQL come MongoDB trasformando gli XML nei corrispettivi BSON?
Per i singoli lemmi (casa, albero, ecc) è poca roba mentre per le singole opere parliamo magari di 8MB o più di XML.
Ha senso e conviene tramutare un intero libro in XML in un record BSON da salvare su Mongo?
Per le opere al momento la mole dei dati non sarebbe relativa all'alto numero delle stesse quanto poche in numero ma molto pesanti.
L'applicazione sarà un'applicazione Web sviluppata in JAVA.
Nel primo caso (File XML) ci sarebbe in output una trasformazione in HTML tramite XSLT.
Conosco poco i DB NoSQL quindi volevo capire se poteva essere un'opzione valida, di fatto qua stiamo ragionando a "Documenti" e "citazioni" (come relazioni tra i dati).
Tnx.