SZÓKAPTÁR/KOLLEX

SZÓKAPTÁR: Német–magyar SZÓkapcsolatTÁR. Korpuszalapú kollokációs tanulószótár.

KOLLEX: deutsch-ungarisches KOLLokationsLEXikon. Korpusbasiertes Wörterbuch der Kollokationen. Deutsch als Fremdsprache.

Szeged: Grimm Kiadó 2014.

ISBN 978 963 9954 80 9

1. Erläuterung des Wörterbuch-Kurztitels

Der Originaltitel auf Ungarisch lautet „Német-magyar SZÓkapcsolatTÁR“, abgekürzt „SZÓKAPTÁR“. Die wörtwörtliche Übersetzung des Titels lautet ‘deutsch-ungarisches WÖRTERkombinationsBUCH’, aus dessen Abkürzung ergibt sich aber ein unbrauchbarer Titel: WÖRTERkombBUCH. Aus diesem Grund musste ein anderer Titel gewählt werden – wenn er auch in gewisser Weise irreführend wirkt –, nämlich „Deutsch-ungarisches KOLLokationsLEXikon“, kurz: KOLLEX. Leider gehen die zusätzlichen Bedeutungen und Assoziationen des ungarischen Akronyms verloren, da „SZÓ-KAPTÁR“ auf Deutsch ‘Wörter-Bienenstock’ heißt und „SZÓTÁR“ ‘Wörterbuch’.

2. Das KOLLEX in Zahlen

Die Metapher liegt auf der Hand: wie die emsigen Bienen den Blütenstaub von den verschiedensten Blüten im Bienenstock sammeln, so haben die Projektmitglieder jahrelang aus mehreren Korpora sowie ein- und zweisprachigen Wörterbüchern die Wörter bzw. Kotextpartner und die verschiedenen Daten zu den Lemmazeichen in der Datenbasis von KOLLEX gesammelt.
Das korpusbasierte syntagmatische Wörterbuch KOLLEX enthält 48 757 Kotexte (sememspezifische Kollokationen und (freie) Wortverbindungen), 10 313 Kotextpartner (im Register der Kollokatoren und Kotextpartner auch separat verzeichnet) und 2262 Wörterbuchartikel (Lemmazahl des Basis-Wörterverzeichnisses).
Die genaue Aufteilung der Wöterbuchartikel auf die einzelnen Wortarten sieht folgendermaßen aus:
1274 Substantivartikel
579 Verbartikel
362 Adjektivartikel
47 Adverbartikel
Das nächste Abschnitt stellt das Wörterbuch und die ihm zugrundegelegten Begrifflichkeiten kurz zusammengefasst vor.

3. Kurze Wörterbuchcharakteristik

In Anlehnung an Hollós (vgl. 2004a: 174) kann man das KOLLEX wie folgt definieren:

korpus- und datenbankbasiertes, polyakzessives und -funktionales, dennoch produktionsbezogenes zweisprachiges syntagmatisches Lernerwörterbuch mit einem primären Wörterverzeichnis der Basen und einem z.T. automatisch generierbaren sekundären der Kollokatoren und zusätzlich mit einem deutschen Register der Kollokatoren mit ihren jeweiligen Basen.

Im Folgenden möchte ich die oben hervorgehobenen Eigenschaften kurz erläutern.
KOLLEX ist korpusbasiert konzipiert, weil verlässliche Daten über lexikalische Kookkurenzen im Deutschen nur anhand des tatsächlichen Sprachgebrauchs gewonnen werden können. Dies ist nur mit großen, elektronisch gespeicherten und annotierten Korpora mit statistischen Analysetools möglich. Die Daten wurden anhand des Leipziger Korpus Deutscher Wortschatz statistisch erhoben, manuell und sememspezifisch ausgewählt und automatisch in die Datenbank eingelesen. Die Liste der Kotextpartner zum jeweiligen Lemmazeichen wurde dann mit Hilfe der CCDB (Kookkurrenzdatenbank) und der neukonzipierten Wörterbücher erweitert.
KOLLEX ist datenbankbasiert. Eine so enorme Menge an Daten, die im fünfstelligen Bereich automatisch eingelesen und auch stark vernetzt werden muss, damit die Datenbasis mit einer neuen Komponente, nämlich mit dem zweiten Wörterverzeichnis erweitert werden kann, ist mit den traditionellen Methoden nicht mehr zu bewältigen.
Damit wird den neuen Anforderungen für die Lexikographie genüge getan. Erstens wird dadurch das Cross-media-Publishing ermöglicht, weil das konzeptionelle Datenmodell von der Festlegung der Präsentation der Daten (Print- oder digitale Version) separiert wird. Zweitens wird dadurch der Workflow und die Kommunikation zwischen den Projektbeteiligten effektiv unterstützt. Das gewährleistet ein eigens für dieses „Wörterbuch“ entwickeltes, XML-basiertes Datenbankmanagmentsystem mit einer benutzerfreundlichen Arbeitsschnittstelle mit Eingabemasken. Dieses Tool, womit man zweisprachige syntagmatische Wörterbücher erstellen kann, ist ein schönes Beispiel für die interdisziplinäre Zusammenarbeit auf dem Gebiet der Informatik und Lexikographie.
Die folgende Abbildung zeigt die Startseite des Wörterbuchprogramms mit den wichtigsten Funktionen. Links ist die Lemmaliste mit dem Erstellungsdatum, mit der Autorennamensigle, sowie dem Status der Wörterbuchartikel (fertig, nicht fertig) bzw. dem der Redaktion (redigiert, nicht redigiert). Im rechten Fenster erscheint die provisorische Druckansicht des ausgewählten Wörterbuchartikels zu Wörterbuch. Bei der Textgenerierungsfunktion für die mehrfachen Lektorierungen erscheinen die Wörterbuchartikel auch in derselben Form in einem separaten Rich-Text-Dokument.
KOLLEX ist ein Lernerwörterbuch mit der Zielsetzung, Deutschlernern mit mittlerem und höherem Sprachniveau v.a. in Produktionssituationen, in denen die Syntagmatik eine enorme Rolle spielt, mit dem nötigen Nachschlagewerk auszuhelfen. Die anvisierte Benutzergruppe für KOLLEX besteht in erster Linie aus DAF-Lernern, Germanistikstudenten als „professionellen“ Deutschlernern und auch Deutschlehrern. Letztere können sich mit Hilfe von KOLLEX der Kombinationsfähigkeit deutscher Lexeme vor allem bei der Korrektur der Schülerarbeiten vergewissern.
KOLLEX ist deutsch-ungarisch, also zweisprachig konzipiert. Die deutschen typischen/usuellen Kollokationen und Kotexte werden nicht auf Deutsch erklärt, sondern übersetzt. Aus diesem Grund werden als Datentypen für die Übersetzungsäquivalente der Kotextpartner sowie der Kollokationen/Kotexte (und selbstverständlich auch der Lemmazeichen) vorgesehen.
KOLLEX ist produktionsbezogen. Das Wörterbuch bietet vor allem Antworten auf Lexemverwendungsfragen hinsichtlich der Flexion, Valenz oder der Kotextpartner (gleichzeitig für Kotexte und Kollokationen) mit ihrer Valenzpotenz. Des Weiteren werden Lexemfindungs- und Lexemalternantenfragen in Bezug auf die Kotextpartner des Lemmazeichens beantwortet (vgl. Engelberg/Lemnitzer 2008: 102).
Die im KOLLEX verzeichneten Daten sind – wegen der Sprachrichtung Dt.→Ung. und des Registers der deutschen Kotextpartner (mit ihrem sememspezifischen Vorkommen unter der jeweiligen Basis) mit mehr als 10 000 Einträgen – mit Einschränkung auch in Sprachrezeptions- und Herübersetzungssituationen gut brauchbar. Eine wichtige Rolle wurde bei der Konzipierung des Wörterbuchs der Studierfunktion zugeschrieben. Die systematische Markierung der Interferenzfehler durch das Warnsymbol u.a. dient gerade diesem Zweck. Zusammenfassend kann man sagen, dass das KOLLEX polyfunktional, aber dennoch produktionsbezogen ist.
KOLLEX ist ein syntagmatisches Wörterbuch und die Syntagmatik findet dementsprechend auf zwei Ebenen Berücksichtigung: auf der lexikalischen und auf der grammatischen. Der Syntagmatik auf der lexikalischen Ebene wird in Form von Daten zu Kotextpartnern (Kombinationspartner → freie Wortverbindung bzw. Kollokator → Kollokation), zu Wortverbindungen, zu Kollokationen und zu Phrasemen des Peripheriebereichs Rechnung getragen. Im Rahmen der Syntagmatik auf der grammatischen Ebene wird die Valenzpotenz der Lemmazeichen und die der Kollokationen und freien Wortverbindungen dargestellt. Die komplexe, grammatisch-lexikalische Ebene der Syntagmatik manifestiert sich in obligatorischen und ggf. fakultativen Valenzrealisierungen zu den Lemmazeichen. KOLLEX ist also kein reines Kollokationswörterbuch, sondern eine Kombination eines Kollokations- und Valenzwörterbuchs, also ein syntagmatisches Wörterbuch.

4. Der integrative Kollokationsbegriff von KOLLEX

Der integrative Kollokationsbegriff von KOLLEX vereint vier Aspekte in sich:

1. Fremdsprachendidaktik, 2. Semantik, 3. Korpuslinguistik und 4. Syntax (Valenz) – Morphosyntax (Gebrauchspräferenzen und -restriktionen) (vgl. Hollós 2004b)

Gemäß der fremdsprachendidaktisch orientierten Kollokationsauffassung (vgl. Hausmann 1984, 2004) sind die Komponenten einer Kollokation nicht gleichrangig, sondern der semantisch autonome Teil ist die Basis und der dazu affine der Kollokator.
Es werden folgende sechs Strukturtypen festgelegt, bei denen die Basis fett hervorgehoben wird:

SUBS + SUBSz.B. ein Stoß Wäsche
ADJ + SUBSz.B. stimmgewaltiger Sänger
SUBS + VERBz.B. ein Eis schlecken
ADV + VERBz.B. sich schlagartig ändern
ADV + ADJz.B. landläufig bekannt
ADV + ADVz.B. gänzlich anders.

Dem fremdsprachendidaktischen Aspekt trägt auch die Markierung der Interferenz Rechnung. Aus Platzgründen kann ich auf die im Wörterbuch auffindbaren Arten der Interferenz hier nicht eingehen.
Semantisch gesehen zeichnen sich Kollokationen dadurch aus – das ist auch Folge ihres inneren Aufbaus –, dass sie nicht-, schwach- oder teilidiomatisch sind, aber keinesfalls vollidiomatisch. Die meisten Kollokationen sind nichtidiomatisch (triftiger Grund, ausgiebig frühstücken) und nur wenige sind schwach idiomatisch (die Ampel überfahren, körpereigene Drogen). Einen besonderen Typ stellen im vorliegenden Wörterbuch die teilidiomatischen Kollokationen dar, deren Kollokator ein Phrasem darstellt: in der Regel ist es ein adverbial gebrauchter Phraseologismus (sich zu Tode langweilen). Nur solche wurden für die Wörterbuchartikel selektiert, deren Kollokationspotenzial hinsichtlich der Basis groß genug ist und deshalb nicht als phraseologische Varianten eines bestimmten Typs zu betrachten sind.
Der korpuslinguistische Aspekt will die tiefe Trennung zwischen den zwei großen Fronten der Kolloktionsforschung, die der korpusorintierten und die der systemorientierten aufheben. Dabei werden die fremdsprachendidaktischen und semantischen Aspekte mitberücksichtigt. Kollokationen sind demnach signifikante Kookkurrenzen zu den Basislemmata entsprechend den Strukturformeln, die mindestens aus zwei Autosemantika bestehen und nicht vollidiomatisch sind. Es ist sinnvoll, die interlingualen Kollokationen getrennt zu behandeln, da sie ihren Status allein der Interferenz zwischen zwei Sprachen verdanken, z.B. dt. sich die Zähne putzen - ung. fogat mos (wortwörtliche dt. Übersetzung Zähne waschen). Währenddessen stellen intralinguale Kollokationen innerhalb einer Sprache typische Verwendungen, statistisch nachweisbare signifikante Kookkurrenzen dar, z.B. bitterlich weinen.
Der letzte, syntaktische Aspekt besagt, dass die Zahl der Autosemantika innerhalb der Kollokation ≥ 2 ist. Die Basis und der Kollokator einer Kollokation können abhängig von ihrer Wortart Valenzpotenzen haben, letztere werden entweder als obligatorische oder fakultative Ergänzung, ggf. als obligatorische Angabe – abhängig vom jeweiligen Valenzmodell, das zugrunde gelegt wird – aufgefasst. Die Kollokationen als Ganzes verfügen oft – ähnlich wie Phraseologismen – über Gebrauchspräferenzen, die im Einzelnen noch kaum untersucht worden sind.

5. Zitierte Literatur

Engelberg, Stefan/Lemnitzer, Lothar (2009): Lexikographie und Wörterbuchbenutzung. 4., überarb. und erw. Aufl. Tübingen.

Hausmann, Franz Josef (1984): Wortschatzlernen ist Kollokationslernen. Zum Lehren und Lernen französischer Wortverbindungen. In: Praxis des neusprachlichen Unterrichts 31. 395-406.

Hollós, Zita (2004a): Lernerlexikographie: syntagmatisch. Konzeption für ein deutsch-ungarisches Lernerwörterbuch. Tübingen. (= Lexicographica. Series Maior 116)

Hollós, Zita (2004b): Konzeption eines zweisprachigen syntagmatischen Lernerwörterbuchs. In: Studien zur zweisprachigen Lexikographie mit Deutsch IX. Hrsg. von Herbert Ernst Wiegand. Hildesheim. Zürich. New York, 91-133. (= Germanistische Linguistik 178/2004)

Primäre Quellen von KOLLEX

[CCDB] Belica, Cyril: Kookkurrenzdatenbank CCDB. Eine korpuslinguistische Denk- und Experimentierplattform für die Erforschung und theoretische Begründung von systemisch-strukturellen Eigenschaften von Kohäsionsrelationen zwischen den Konstituenten des Sprachgebrauchs. 2001 ff., Institut für Deutsche Sprache, Mannheim. Internet-Adresse: http://corpora.ids-mannheim.de/ccdb [am 17.12.2012].

[IDS] COSMAS-II-KORPORA. Institut für Deutsche Sprache, Mannheim. Internet-Adresse: http://corpora.ids-mannheim.de [am 17.12.2012].

[DTWSCH] LEIPZIGER KORPUS. Deutscher Wortschatz. Internet-Adresse: http://wortschatz.informatik.uni-leipzig.de/ [am 17.12.2012].

Ausgewählte Bibliographie zum KOLLEX (deutsch)

Hollós, Zita: Lernerlexikographie: syntagmatisch. Konzeption für ein deutsch-ungarisches Lernerwörterbuch. Tübingen 2004. (= Lexicographica. Series Maior 116)

Hollós, Zita: Konzeption eines zweisprachigen syntagmatischen Lernerwörterbuchs. In: Studien zur zweisprachigen Lexikographie mit Deutsch IX. Hrsg. von Herbert Ernst Wiegand. Hildesheim. Zürich. New York 2004, 91-133. (= Germanistische Linguistik 178/2004) Hollos_2004_Konzeption_Germanistische Linguistik 178.pdf

Hollós, Zita: Syntagmatische Beispielangaben in einem korpusbasierten zweisprachigen Lernerwörterbuch. In: Praktische Aspekte der Lexikographie. Beiträge des Lexikographischen Workshops am16.-17. Oktober 2003 an der Eötvös-Loráns-Universität Budapest. Hrsg. von Koloman Brenner, Roberta Rada. Budapest 2005, 111-125.

Hollós, Zita: KOLLEX. Ein zweisprachiges Kollokationswörterbuch beim Sonderfall übersetzungsnahe Sprachproduktion. In: Germanistische Linguistik. 4. Lexikographisches Kolloquium zur Lexikographie und Wörterbuchforschung. Universität Maribor, 20. bis 22. Oktober 2006. Hrsg. von Vida Jesenšek und Alja Lipavic Oštir. Hildesheim. New York 2008, 144-153. Hollos_2008_KOLLEX. Ein zweisprachiges Kollokationswörterbuch_Germanistische Linguistik 195-196.pdf

Hollós, Zita: Kollokationen und weitere typische Mehrwortverbindungen in der ungarischen Lexikographie. In: Franz Josef Hausmann (Hg.): Collocations in European lexicography and dictionary research. Kollokation in der europäischen Lexikographie und Wörterbuchforschung. Tübingen 2008, 121-133. (= Lexicographica 24) Hollos_2008_Kollokationen und weitere typische Mehrwortverbindungen_Lexicographica 24.pdf

Hollós, Zita: Innovationskraft zweisprachiger Lernerwörterbücher in der ungarischen Lexikographie. In: Lexicographica 25. Tübingen 2009, 91-108.

Hollós, Zita: Auf dem schmalen Grat zwischen Kollokationen und festen Wortverbindungen. In: Feste Wortverbindungen und Lexikographie. Kolloquium zur Lexikographie und Wörterbuchforschung. Hrsg. von Peter Ďurčo. New York 2010, 85-96. (Lexicographica. Series Maior 138) Hollos_2010_Auf dem schmalen Grat_Lexicographica. Series Maior 138.pdf

Hollós, Zita: Lassen sich Stereotype statistisch erfassen? Zugänge der Phraseologie – am Beispiel der Kollokationen. In: Czeglédy Anita, Ernest W. B. Hess-Lüttich, Ulrich H. Langanke (Hrsg.): Deutsch im interkulturellen Begegnungsraum Ostmitteleuropa. Frankfurt a. M. 2010, 409-428.

Hollós, Zita: Interferenzkandidaten in zweisprachigen Lernerwörterbüchern, insbesondere im deutsch-ungarischen Kollokationslexikon KOLLEX. In: Lexicographica 29. Tübingen 2013, 92-116. Hollos_2013_Interferenzkandidaten_Lexicographica 29.pdf

Hollós, Zita: Syntagmatik im KOLLEX: Die lexikographische Darstellung grammatischer Syntagmatik in einem zweisprachigen Kollokationslexikon für Deutschlerner. In: Zweisprachige Lexikographie zwischen Translation und Didaktik. Hrsg. von María José Domínguez Vázquez, Fabio Mollica und Martina Nied Curcio. Berlin/Boston 2014, 113-129. (Lexikographica. Series Maior 147) Hollos_2014_Syntagmatik im KOLLEX_Lexikographica. Series Maior 147.pdf

Hollós, Zita: Ein Stiefkind der Kollokationsforschung. Kollokationen mit Adverbien. In: Das Wort – ein weites Feld. Festschrift für Regina Hessky. Hrsg. von Ida Dringó-Horváth, József Fülöp, Zita Hollós, Petra Szatmári, Anita Szentpétery-Czeglédy und Emese Zakariás. Budapest 2014, 25-39. Hollos_2014_Ein Stiefkind der Kollokationsforschung_Festschrift für Regina Hessky.pdf

Ausgewählte Bibliographie zum KOLLEX (ungarisch)

11. Hollós, Zita: A lexikográfiai folyamat a SZÓKAPTÁR, egy korpuszalapú kollokációs aktív szótár példáján keresztül. Projektbeszámoló. [Der lexikographische Prozess am Beispiel des KOLLEX, eines korpusbasierten produktionsorientierten Kollokationswörterbuchs. Projektbericht.] In: Magay Tamás (Szerk.): Félmúlt és közeljövő. Budapest 2007, 237-256. (Lexikográfiai füzetek 3) Hollos_2007_A lexikográfiai folyamat_Lexikográfiai füzetek 3.pdf

17. Hollós, Zita: Az ördög a részletekben, mármint a szelekcióban rejlik – egy korpuszalapú kollokációs szótár, a SZÓKAPTÁR margójára. [Der Teufel steckt im Detail, genauer: in der Selektion – Bemerkungen zum korpusbasierten Kollokationslexikon KOLLEX.] In: Pintér Tibor, Pődör Dóra, P. Márkus Katalin (Szerk.): Szavak pásztora. Írások Magay Tamás tiszteletére. Szeged 2012, 222-241. Hollos_2012_Az ördög a részletekben, mármint a szelekcióban rejlik_Magay Tamás emlékkötet.pdf