myCSharp.de - DIE C# und .NET Community
Willkommen auf myCSharp.de! Anmelden | kostenlos registrieren
 
 | Suche | FAQ

» Hauptmenü
myCSharp.de
» Startseite
» Forum
» FAQ
» Artikel
» C#-Snippets
» Jobbörse
» Suche
» Regeln
» Wie poste ich richtig?
» Forum-FAQ

Mitglieder
» Liste / Suche
» Wer ist wo online?

Ressourcen
» openbook: Visual C#
» openbook: OO
» Microsoft Docs

Team
» Kontakt
» Übersicht
» Wir über uns

» myCSharp.de Diskussionsforum
Du befindest Dich hier: Community-Index » Diskussionsforum » Entwicklung » Datentechnologien » XML Datei zerlegen
Letzter Beitrag | Erster ungelesener Beitrag Druckvorschau | Thema zu Favoriten hinzufügen

geschlossen (weitere Infos)
Zum Ende der Seite springen  

XML Datei zerlegen

 
Autor
Beitrag « Vorheriges Thema | Nächstes Thema »
Anna85 Anna85 ist weiblich
myCSharp.de-Mitglied

Dabei seit: 11.04.2019
Beiträge: 58
Herkunft: Ulm


Anna85 ist offline

XML Datei zerlegen

Beitrag: beantworten | zitieren | editieren | melden/löschen       | Top

verwendetes Datenbanksystem: <Microsoft Management Studio>

Hallo, ich habe eine ziemlich große xml Datei - 8GB. Sie ist wie folgends aufgebaut:

Code:
1:
2:
3:
4:
5:
6:
7:
8:
9:
10:
11:
12:
13:
14:
<?xml version="1.0"><collection xmlns=....>
<record type="zeitung">
  <id>texta </id>
     <buch> abc </buch>
</record >
<record type="zeitung">
  <id>textb </id>
     <buch> def </buch>
</record >
<record type="zeitung">
  <id>textc</id>
     <buch> ghi </buch>
</record >
</collection>

Wie kann ich jetzt die Datei in 4 Dateien zerlegen? Habe ich an Tolls gesucht, aber bisher nichts gefunden. Die Datensätze haben keine ids, also kann ich auch nicht sagen, von wo bis wo.
Ich werde mich über jede Tipp freuen.

Viele Grüße
Anna

Dieser Beitrag wurde 1 mal editiert, zum letzten Mal von Anna85 am 01.10.2019 12:07.

01.10.2019 11:52 E-Mail | Beiträge des Benutzers | zu Buddylist hinzufügen
Abt
myCSharp.de-Team

avatar-4119.png


Dabei seit: 20.07.2008
Beiträge: 13.236
Herkunft: Stuttgart/Stockholm


Abt ist offline

Beitrag: beantworten | zitieren | editieren | melden/löschen       | Top

Magst Du Dich nach all den Thema dazu nicht einfach mal grundlegend mit XML beschäftigen; was die Konzepte von XML sind und wie man sie allgemein liest / zerlegt?

XML ist sooo weit verbreitet; ich kann Dir beim besten Willen nicht glauben, dass Du nichts findest.....
Auf mich wirkt das einfach so, dass Du gewisse Aufgaben aufs Forum abwälzt - sorry.
01.10.2019 12:52 Beiträge des Benutzers | zu Buddylist hinzufügen
T-Virus T-Virus ist männlich
myCSharp.de-Mitglied

Dabei seit: 17.04.2008
Beiträge: 1.364
Entwicklungsumgebung: Visual Studio, Codeblocks, Edi
Herkunft: Nordhausen, Nörten-Hardenberg


T-Virus ist offline Füge T-Virus Deiner Kontaktliste hinzu

Beitrag: beantworten | zitieren | editieren | melden/löschen       | Top

Mal davon abgesehen, dass Abt hier schon etwas Recht hat und du dich dringend mit XML beschäftigen solltest, haben deine Datensätze doch offensichtlich eine id in Form des <id> Tags.
Da deine Xml scheinbar auch nur eine Collection ist mit entsrechenden Record Objekten sind, wirst du wohl nicht drum herum kommen, diese einzulesen und dann zu verarbeiten.

Dann hast du aber am Ende aber 4 Dateien mit dem gleichen Aufbau.
Ohne den Anwendungsfall zu kennen, würde ich erstmal von unnötiger Splittung und somit auch unnötiger Mehrarbeit für dich ausgehen.
Auch wenn die Datei 100GB groß wäre, sollte dies zum auslesen/verarbeiten der Daten keine Rolle spielen.
Und händisch willst du dies kaum lösen wollen, da in 8GB XML schon einiges an Daten drin stehen dürfte.

T-Virus
01.10.2019 13:00 E-Mail | Beiträge des Benutzers | zu Buddylist hinzufügen
Anna85 Anna85 ist weiblich
myCSharp.de-Mitglied

Dabei seit: 11.04.2019
Beiträge: 58
Herkunft: Ulm

Themenstarter Thema begonnen von Anna85

Anna85 ist offline

Beitrag: beantworten | zitieren | editieren | melden/löschen       | Top

Hi Abt, du hast Recht, ich möchte euch was fragen, da ich davon ausgehe,, dass die Forums für so was da sind.

Du kennst dich aus- super. Ich benötige Hilfe.

Ich schreibe bzw. versuche ich einen Script zu schreiben, um die datei auf 4 dateien zerlegen. Grund ist: in unserem DB kann ich max 5 GB hochladen, es gibt sonst Probleme.

Habe ich jetzt genug gesagt?
Ich möchte keine Lösung, ich möchte Rat und Tipps.

Danke!
Jetzt kann mein Post hier abgeschlossen sein. Ich versuche es irgendwie schon. Ich frage mich nur, wozu ist ein Forum: auf Fragen zu beantworten ...

Viele Grüße
Anna
01.10.2019 13:09 E-Mail | Beiträge des Benutzers | zu Buddylist hinzufügen
Abt
myCSharp.de-Team

avatar-4119.png


Dabei seit: 20.07.2008
Beiträge: 13.236
Herkunft: Stuttgart/Stockholm


Abt ist offline

Beitrag: beantworten | zitieren | editieren | melden/löschen       | Top

Zitat von Anna85:
ich möchte euch was fragen, da ich davon ausgehe,, dass die Forums für so was da sind.

Da hast Du was falsch verstanden. fröhlich
Das Forum ist für konkrete Probleme da - wir sind aber keine kostenlosen Lehrer, die Dir XML beibringen.

Du bist selbst in der Verantwortung Dir gewisse Dinge eigenständig beizubringen.
Jedes Forum dieser Erde erwartet Eigenitiative.

Die XML Frage hier, wie man XML Dateien richtig liest, behandelt quasi jedes XML Tutorial.
Wird sich vermutlich nicht "zerlegen" nennen; im Endeffekt ist es aber nur Nodes lesen und Node schreiben.
Gelerntes anwenden: fertig.

Zitat von Anna85:
Ich möchte keine Lösung, ich möchte Rat und Tipps.

In den letzten Themen ging es immer um grundlegende Dinge - wie auch diesem.
Und wenn Du Dich einfach mal ein paar Minuten selbst mit XML beschäftigen würdest, würden sich zum einen gewisse Fragen gar nicht ergeben und zum anderen hättest Du selbst schneller eine Antwort als dass ein Helfer Dein Thema liest und Dir antwortet.
01.10.2019 13:21 Beiträge des Benutzers | zu Buddylist hinzufügen
T-Virus T-Virus ist männlich
myCSharp.de-Mitglied

Dabei seit: 17.04.2008
Beiträge: 1.364
Entwicklungsumgebung: Visual Studio, Codeblocks, Edi
Herkunft: Nordhausen, Nörten-Hardenberg


T-Virus ist offline Füge T-Virus Deiner Kontaktliste hinzu

Beitrag: beantworten | zitieren | editieren | melden/löschen       | Top

Für mich klingt eure Datenbank etwas komisch.
Warum ist diese auf 5 GB limitiert?

Ist dies eine Relationale DB wie der SQL Server oder eine Dokumenten DB ala Couch DB o.ä.?
Wenn ihr eine Relationale DB habt, ist der Ansatz XML Dateien zu speichern schon der Falsche.
Hier sollten die Daten in ihre Relationen umgewandelt und gespeichert werden.
Dies dürfte die Datenmenge schon erheblich verkleinern.

Bei einer Dokumenten DB würde ich nicht erwarten, wenn ihr mit großen XML Dateien arbeitet, dass ihr hier ein Limit von 5GB setzt.
XML Dateien können hier in der Regel auch schnell mal 10-100GB groß werden, je nachdem was man darin speichert.
XML ist eben nicht auf kompakte Datenhaltung ausgelegt.

Ansonsten wäre auch zu überlegen, ob ihr eurer Datenformat nicht auf ein kompakteres Format wie json oder gar binäre Formate umstellt, wenn Speicherplatz ein solches Problem für euch darstellt.
Dürfte auch die Verarbeitung um einiges effizienter gestalten.

T-Virus
01.10.2019 13:33 E-Mail | Beiträge des Benutzers | zu Buddylist hinzufügen
gfoidl gfoidl ist männlich
myCSharp.de-Team

avatar-2894.jpg


Dabei seit: 07.06.2009
Beiträge: 6.600
Entwicklungsumgebung: VS 2019
Herkunft: Waidring


gfoidl ist offline

Beitrag: beantworten | zitieren | editieren | melden/löschen       | Top

Hallo,

wegen  Crosspost mach ich hier zu.

Ergänzend zu Abts Hinweisen, sollten auch  [Hinweis] Wie poste ich richtig? Punkt 2.2 beachtet werden -- aus dort genannten Gründen.

mfG Gü
01.10.2019 20:45 Beiträge des Benutzers | zu Buddylist hinzufügen
Baumstruktur | Brettstruktur       | Top 
myCSharp.de | Forum Der Startbeitrag ist älter als 2 Monate.
Der letzte Beitrag ist älter als 2 Monate.
geschlossen (weitere Infos)


© Copyright 2003-2019 myCSharp.de-Team | Impressum | Datenschutz | Alle Rechte vorbehalten. | Dieses Portal verwendet zum korrekten Betrieb Cookies. 06.12.2019 21:36