#1 Erweiterter Zugriff auf Audiodateien von Robbson 03.08.2008 20:08

Hallo,

ich spiele mit dem Gedanken, mir ein paar zusätzliche Vertonungen für meine Vokabeln einzufügen. Naja, "ein paar" ist reichlich untertrieben. Es werden wohl eher mehrere zehntausende Vertonungen sein. Gemäß der jetzigen Möglichkeiten würde das bedeuten: 1 Datei = 1 Vertonung. Das ist natürlich ziemlich unhandlich. Besser wäre es, alle Vertonungen (oder Gruppen von je 100 Stück oder je Anfangsbuchstabe) in eine einzige Tondatei zu packen, um dann per Dateipositionsindex darauf zuzugreifen. So ähnlich wird es wohl auch bei den mitgelieferten Vertonungen gemacht, wobei es sich bei der Datensammlung wohl eher um ein Mischmasch aus Lame kodierten MP3 Dateien und Zusatzdaten handelt (datenbankartig).

Als Verweis auf eine Vertonung muß dann nur noch die Datei, die Dateiposition und natürlich die Länge angegeben werden.
Besteht irgend eine Chance, einen derartigen Zugriff in den Vokabeltrainer einzubauen? Im Prinzip müßte neben dem üblichen Dateizugriff nur ein zusätzliches File-Seeking durchgeführt werden.

Grüße,
Robbson.
#2 Re: Erweiterter Zugriff auf Audiodateien von Andres 03.08.2008 20:33

Hallo Robbson,

meinst du damit das gleiche wie hier Klick ?
#3 Re[2]: Erweiterter Zugriff auf Audiodateien von Robbson 03.08.2008 21:10

Andres>Hallo Robbson,
Andres>meinst du damit das gleiche wie hier Klick ?

Hallo Andres,

vielen Dank für den Hinweis!
Ich hatte mir die *.mi3 Dateien zwar bereits angeschaut, allerdings habe ich nicht damit gerechnet, daß man diese direkt im Programm auswählen und importieren kann. Ich sehe schon, der VT3 steckt ja voller Überraschungen.
Jetzt müßte es für dieses Format nur noch eine Spezifikation geben, da es natürlich nicht so schön einfach zu lesen ist, wie die XML-Dateien *vt3.
Allerdings ist der grundlegende Aufbau nicht schwer zu erkennen. Erst aufsteigende Indexpositionen und dann die Worte und Sätze als UTF16 Strings. Nur wer genau auf was in welche der zugehörigen *.md3 Dateien verweist, muß noch herausgefunden werden...

Grüße,
Robbson.
#4 Re[3]: Erweiterter Zugriff auf Audiodateien von samy 03.08.2008 21:43

Andres>>Hallo Robbson,
Andres>>meinst du damit das gleiche wie hier Klick ?

Robbson>Hallo Andres,

Robbson>vielen Dank für den Hinweis!
Robbson>Ich hatte mir die *.mi3 Dateien zwar bereits angeschaut, allerdings habe ich nicht damit gerechnet, daß man diese direkt im Programm auswählen und importieren kann. Ich sehe schon, der VT3 steckt ja voller Überraschungen.
Robbson>Jetzt müßte es für dieses Format nur noch eine Spezifikation geben, da es natürlich nicht so schön einfach zu lesen ist, wie die XML-Dateien *vt3.
Robbson>Allerdings ist der grundlegende Aufbau nicht schwer zu erkennen. Erst aufsteigende Indexpositionen und dann die Worte und Sätze als UTF16 Strings. Nur wer genau auf was in welche der zugehörigen *.md3 Dateien verweist, muß noch herausgefunden werden...

Robbson>Grüße,
Robbson>Robbson.

Woher hast du *.mi3-Dateien??

Gruß

Samy
#5 Re: Erweiterter Zugriff auf Audiodateien von Andres 03.08.2008 21:47

@Robbson

Ich muss zugeben, rein technisch verstehe ich nicht so ganz die Hintergründe, doch Herr Grassau hat ja was in Aussicht gestellt… Aber ob es jetzt das ist was du meinst? Hmm …

@Sammy

Ich glaube Robbson meint die, die der Vokabeltrainer automatisch unter "Media" installiert (also die Mitgelieferten) Oder irre ich mich da?
#6 Re: Erweiterter Zugriff auf Audiodateien von Robbson 04.08.2008 01:17

Ok, ich habe den Aufbau der *.mi3 und *.md3 Dateien soeben geknackt. War garnicht so schwer, auch wenn ich mich 2x im Ansatz irrte.
Es gibt zwar noch ein paar Byte, deren Bedeutung mir nicht klar ist (diese sind immer gleich), aber alles andere paßt.

Eigentlich ist es ganz einfach:

Jede Sammlung von Vertonungen besteht aus 2 Dateien: einer Datei mit der Endung ".md3" und eine Datei mit der Endung ".mi3".

In der md3-Datei stehen einfach direkt hintereinander MP3 Files (einige mit dem alten Xing-Encoder komprimiert, die überwiegende Mehrheit aber mit LAME). Die meisten dieser zusammengeketteten MP3 Dateien haben am Ende ein Custom Tag angehängt, wo das Wort nochmal als String gspeichert ist, einige besitzen auch ein ID3 Tag.

So, und damit man nicht vergisst, wo die einzelnen MP3 Dateien in dem riesigen md3-Paket anfangen und enden, gibt es die mi3-Indexdatei. Die besteht zunächst aus einem Header mit allen Infos zur Datei, etwa der Anzahl der Einträgen. In "Audio-De-W-V3En.mi3" sind es bspw. 5479 Einträge, d.h. natürlich auch, daß sich genausoviele MP3-Dateien in der md3-Datei befinden.

Danach folgt eine Tabelle zu jedem dieser Einträge, in der zu den UTF16 Strings (Strings auf Basis von 2Byte-Zeichen anstelle der klassischen 1Byte-Zeichen) am Dateiende referenziert wird (also Dateioffset+Stringlänge in Bytes). An jeder dieser Stellen findet man praktisch den Dateinamen der MP3-Datei, der dem Namen des Wortes/der Phrase/des Satzes entspricht.
Außerdem befindet sich in der Tabelle noch die "berühmte" fortlaufende Nummer, auch wenn die Reihenfolge nicht immer linear ist.

So und dann folgt noch eine Tabelle mit... ja wiedrum 5479 Einträgen. Und hier sind endlich die Verweise zu den MP3 Dateien in der md3 Datei drin (also Offset + Länge).
Allerdings muß man wohl 21 Byte zum Offset dazuzählen, um an die korrekte Positions zu kommen, wieso auch immer.

Danach kommen die oben bereits erwähnten UTF16 Strings.

Und das war's auch schon. Also auf dieser Basis könntet Ihr prinzipiell Eure eigenen Vertonungen in den Vokabeltrainer einbringen, so als würden sie original zum Programm dazugehören.

Ich werde bei Gelegenheit einen kleinen Konverter schreiben, der aus Euren MP3s ein solches Dateipaar erzeugt, wenn es bis dahin nicht schon jemand anderes getan hat.

Grüße,
Robbson.
#7 Re[3]: Erweiterter Zugriff auf Audiodateien von freitag 04.08.2008 01:41

Andres>>Hallo Robbson,
Andres>>meinst du damit das gleiche wie hier Klick ?

Robbson>Hallo Andres,

Robbson>vielen Dank für den Hinweis!

Hey, wovon redet Ihr, was meint Ihr mit "Klick" --- Jetzt, da ich den Editor "auf habe", kriege ich mehr Informationen - aber der "Faden" ist wohl an mir vorbeigegangen! Dich, Robbson, wollte ich nur auf den Beitrag vom großen Meister hinweisen:

http://vokabeln.communityhost.de/threadmsg/?threadmsg__mid=492753477

der darin eigentlich ziemlich konkret darauf hinweist, dass Deine Frage bzw. Dein Wunsch in der nächsten VT Generation (4.0) berücksichtigt wird. Zumindest glaube ich fest daran und es ist für mich ein Grund auf alle Fälle die neue Version zu kaufen.

Nachdem ich Deine Umfrage gelesen habe - und auch oben den Beitrag - hast Du ja ziemlich viel Ahnung von die Technik - isch nüsch! Und solche Döspaddels wie meiner seiner müssen sich die Programme eben von anderen stricken lassen.

Grübel .... grübel .... grübel .... wen oder was Du so alles "gerippt" hast? ... .... grübel .... grübel .... ach, sag's lieber nicht! Nachher kommst Du noch in Schwierigkeiten!

Liebe Grüße
Anne
#8 Re: Erweiterter Zugriff auf Audiodateien von Robbson 04.08.2008 02:39

Hallo freitag oder Anne,

da ich vom Konzept und der Brauchbarkeit des VT so einigermaßen überzeugt bin, habe ich mir halt schon vor einer ganzen Weile überlegt, ob ich nicht Vokabeln aus anderen Programmen, die ich sonst häufig nutzte, in den VT übertragen könnte.

Bisher habe ich das nur 'mal experimentell mit dem tmx Vokabeltrainer versucht, was keine größeren Schwierigkeiten bereitete. Allerdings ist der Prozess noch ziemlich umständlich, wenn man die Importfunktion mit den regulären Ausdrücken des VT verwendet und außerdem fehlen einem dann die Hinweise zu der Wortart, usw.
Richtig gut wird das ganze erst, wenn man direkt in das vt3 konvertiert und jetzt auch noch das md3 / mi3 Format berücksichtigt.

Daß man das "grippte" Vokabular aus Copyright Gründen dann niemandem zum Download anbieten kann ist klar, wer aber beide Programme besitzt kann somit frei wählen, mit welchem Tool er welche Vokabeln lernt.


So, ich sollte jetzt endlich mal schlafen gehen...

Grüße,
Robbson.
#9 Re[2]: Erweiterter Zugriff auf Audiodateien von samy 04.08.2008 11:44

Robbson>Hallo freitag oder Anne,

Robbson>da ich vom Konzept und der Brauchbarkeit des VT so einigermaßen überzeugt bin, habe ich mir halt schon vor einer ganzen Weile überlegt, ob ich nicht Vokabeln aus anderen Programmen, die ich sonst häufig nutzte, in den VT übertragen könnte.

Robbson>Bisher habe ich das nur 'mal experimentell mit dem tmx Vokabeltrainer versucht, was keine größeren Schwierigkeiten bereitete. Allerdings ist der Prozess noch ziemlich umständlich, wenn man die Importfunktion mit den regulären Ausdrücken des VT verwendet und außerdem fehlen einem dann die Hinweise zu der Wortart, usw.
Robbson>Richtig gut wird das ganze erst, wenn man direkt in das vt3 konvertiert und jetzt auch noch das md3 / mi3 Format berücksichtigt.

Robbson>Daß man das "grippte" Vokabular aus Copyright Gründen dann niemandem zum Download anbieten kann ist klar, wer aber beide Programme besitzt kann somit frei wählen, mit welchem Tool er welche Vokabeln lernt.


Robbson>So, ich sollte jetzt endlich mal schlafen gehen...

Robbson>Grüße,
Robbson>Robbson.

Cool. Gib auf jeden Fall bescheid wenn du das md3/mi3-Tool fertig hast ;-)
#10 Re[4]: Erweiterter Zugriff auf Audiodateien von Andres 05.08.2008 11:14

freitag>Hey, wovon redet Ihr, was meint Ihr mit "Klick"

Ich habe den Link nur "Klick" genannt (möglich unter "Hyperlink"), damit die URL nicht so lang ausschaut. Der Link "Klick" führt zum selben Beitrag, den du auch angegeben hast. Wir meinten also dasselbe
#11 Re: Erweiterter Zugriff auf Audiodateien von Jörg-Michael Grassau 05.08.2008 14:37

Hallo Robbson,

ich bin beeindruckt, welche Mühe Ihnen offensichtlich der Umstieg auf den Langenscheidt-Trainer wert ist!

> da ich vom Konzept und der Brauchbarkeit des VT so einigermaßen überzeugt bin

Freut mich ...

Wie schon an anderer Stelle erwähnt, soll es in Version 4 (oder spätestens in einem Update zur Version 4) möglich sein, eigene Media-Sammlungen zu erstellen. Es wird dann natürlich auch eine Möglichkeit geben, Vertonungen, die bisher als Einzeldateien vorliegen und die über ihren Dateinamen mit den Vokabeleinträgen verknüpft sind, automatisch in einer Media-Sammlung zusammenzufassen. In den Media-Sammlungen sind die Dateien für den Vokabeltrainer dann ja, wie Sie wissen, nicht über einen Dateinamen, sondern direkt über den vertonten Text abrufbar; die vertonte Sprache geht aus dem Dateinamen der jeweiligen Media-Sammlung hervor (der in Version 4 aber anders aufgebaut sein wird).

Für Ihre (und viele andere) Zwecke nützlich wäre sicherlich auch eine Importfunktion, die Vertonungslisten (d.h. einfache Textdateien vom Typ [Dateiname]<TAB>[vertonter Text]<ENTER>) verarbeitet und auf diese Weise Vertonungsdateien zusammenstellt - und WAV-Dateien bei der Gelegenheit auf Wunsch gleich ins MP3-Format konvertiert. Das sollte sicherlich kein Problem sein.

Insofern können Sie sich aussuchen, ob Sie Ihr Tool wirklich programmieren wollen oder einfach auf Version 4 warten ... Im zweiten Falle könnten Sie der Festplatte Ihres Computers zwischenzeitlich vielleicht doch ein paar Tausend Vertonungsdateien zumuten und diese dann mit Version 4 automatisch zu Media-Sammlungen zusammenfassen lassen. Eine Möglichkeit, Vertonungen als Teilabschnitte einer längeren Aufnahme abzuspielen (nach dem Motto: die Vertonung für "Haus" befindet sich in der Datei "Aufnahme5.wav" an der Abspielposition 19534 ms bis 19876 ms) wird es nicht geben (das würde spätestens bei MP3-Aufnahmen zu erheblichen Schwierigkeiten führen). Jede Vertonung wird also weiterhin aus eine eigenständigen WAV- oder MP3-Datei bestehen, nur dass diese Dateien eben in den Media-Sammlungen zusammengefasst sind.

Alle, die jetzt schon fleißig eigene Vertonungen erstellen, seien an dieser Stelle schon einmal ermuntert, sicherzustellen, dass bei Ihren Vertonungen Vokabeltext und gesprochener Text wirklich übereinstimmen: Was im Vokabeltext steht, sollte auch gesprochen werden - und nur das. Ausnahme: Was im Schriftstil "Grammatik ..." geschrieben ist (d.h. die kursiven blauen Textteile) wird nicht mitgesprochen (das wird festgelegt unter "Bearbeiten / Schriftstile", Registerkarte "Eigenschaften" mit der Option "Text in diesem Schriftstil ... wird in Vertonungen nicht mitgesprochen"; diese Option ist für alle Grammatik-Schriftstile aktiviert, denn man will ja nicht, dass die Vokabel "laufen v/i" als "laufen intransitives Verb" vorgesprochen wird). Bei Klammerkonstruktionen haben wir es immer so gemacht, dass in derselben Vertonungsdatei zuerst der Text ohne Klammerinhalt gesprochen wird, dann der komplette Text mit Klammerinhalt - z.B. würde der Vokabeltext "(sich) erheben" mit "erheben - sich erheben" gesprochen werden.

> MP3 Files (einige mit dem alten Xing-Encoder komprimiert)

Huch, tatsächlich? Ich dachte, ich hätte sie allesamt mit LAME (damals 3.96) komprimiert. Für Version 4 werden sie ohnehin frisch komprimiert.

Viele Grüße
Jörg-Michael Grassau
#12 Re[2]: Erweiterter Zugriff auf Audiodateien von samy 05.08.2008 19:17

JG>Hallo Robbson,

JG>ich bin beeindruckt, welche Mühe Ihnen offensichtlich der Umstieg auf den Langenscheidt-Trainer wert ist!

JG>> da ich vom Konzept und der Brauchbarkeit des VT so einigermaßen überzeugt bin

JG>Freut mich ...

JG>Wie schon an anderer Stelle erwähnt, soll es in Version 4 (oder spätestens in einem Update zur Version 4) möglich sein, eigene Media-Sammlungen zu erstellen.

...

JG>Viele Grüße
JG>Jörg-Michael Grassau

Hallo Herr Grassau,

vielen Dank für ihren Einsatz.
Können dann auch Mediasammlungen mit Bildern erstellt werden?

Gruß

Samy
#13 Re: Erweiterter Zugriff auf Audiodateien von Andres 05.08.2008 19:49

Ja samy, hier wurde schon was dazu geschrieben: Link
Xobor Forum Software ©Xobor.de | Forum erstellen
Datenschutz