Willkommen auf myCSharp.de! Anmelden | kostenlos registrieren
 | Suche | FAQ

Hauptmenü
myCSharp.de
» Startseite
» Forum
» Suche
» Regeln
» Wie poste ich richtig?

Mitglieder
» Liste / Suche
» Wer ist online?

Ressourcen
» FAQ
» Artikel
» C#-Snippets
» Jobbörse
» Microsoft Docs

Team
» Kontakt
» Cookies
» Spenden
» Datenschutz
» Impressum

  • »
  • Community
  • |
  • Diskussionsforum
Suche Quellen über statistische String/Text Auswertung
Tiega
myCSharp.de - Member



Dabei seit:
Beiträge: 16

Themenstarter:

Suche Quellen über statistische String/Text Auswertung

beantworten | zitieren | melden

Hallo liebe Leute,

ich befasse mich zur Zeit mit Statistik und Analyse von Texten(Emails, WebCrawling) bzw ich versuche mir da Wissen anzueignen.

Hab mich jetzt viel mit regex beschäftigt ist auch soweit alles verstanden. Wollte euch jetzt mal fragen ob ihr da gute Bücher/Tutorials/Videos zu dem Thema kennt da es doch sehr komplex ist.

Danke schon mal im Vorraus

Viele Grüße

Tiega
private Nachricht | Beiträge des Benutzers
herbivore
myCSharp.de - Experte

Avatar #avatar-2627.gif


Dabei seit:
Beiträge: 49.486
Herkunft: Berlin

beantworten | zitieren | melden

Hallo Tiega,

Statistik ist ein weites Feld. Kannst du bitte eingrenzen, welche Themen dich interessieren.

herbivore
private Nachricht | Beiträge des Benutzers
Tiega
myCSharp.de - Member



Dabei seit:
Beiträge: 16

Themenstarter:

beantworten | zitieren | melden

mmh ja hab auch lange überlegt wie ich das beschreibe.
Aber ich mach am besten mal ein beispiel:

Wir Handeln mit Gebrauchten Schiffsmotoren. Da der Markt an sich ja nicht so leicht durch eigene Verkäufe zu analysieren, weil die Absatzzahlen einzelner Motoren zu klein sind, ist wollen wir alle Emails auf Angebote und Anfragen durchsuchen um dadurch einen Analyse anzustellen wie viele Motoren so auf dem Markt sind und wichtiger einen Durchschnittspreis errechnen.

Da jetzt natürlich die Angebote und Anfragen nicht immer einem Standard Format folgen muss ich nach mit Stichwörtern(Motorhersteller, Baureihe, Laufzeit, Währung) die Motoren Identifizieren und Doppelte anhand der Laufzeit erkennen.


Kann man mit dem Beispiel was anfangen?
Ich hoffe :)

Viele Grüße

Tiega
private Nachricht | Beiträge des Benutzers
herbivore
myCSharp.de - Experte

Avatar #avatar-2627.gif


Dabei seit:
Beiträge: 49.486
Herkunft: Berlin

beantworten | zitieren | melden

Hallo Tiega,

ich würde an deiner Stelle nicht nach Statistik, sondern nach Computerlinguistik und da insbesondere nach semantischer Analyse suchen.

herbivore
private Nachricht | Beiträge des Benutzers
Tiega
myCSharp.de - Member



Dabei seit:
Beiträge: 16

Themenstarter:

beantworten | zitieren | melden

ah danke :)
private Nachricht | Beiträge des Benutzers
der-schlingel
myCSharp.de - Member

Avatar #avatar-3239.jpg


Dabei seit:
Beiträge: 799
Herkunft: Österreich/Wien

beantworten | zitieren | melden

Deutlich leichterer Einstieg: Manning: Taming Text.

Sehr gut für Programmierer die nicht forschen sondern vor allem etwas umsetzen wollen.
Dieser Beitrag wurde 1 mal editiert, zum letzten Mal von der-schlingel am .
As a man thinketh in his heart, so he is.
- Jun Fan
Es gibt nichts Gutes, außer man tut es.
- Erich Kästner
Krawutzi-Kaputzi
- Kasperl
private Nachricht | Beiträge des Benutzers