Biografie / Sonstige Angaben

Gerhard Heyer ist Professor emeritus für Automatische Sprachverarbeitung am Institut für Informatik der Universität Leipzig. Vor seiner Universitätstätigkeit war er als Systemspezialist und Leiter von Forschungs- und Entwicklungsaufgaben in der Großindustrie und einer eigenen Firma tätig. Forschungsschwerpunkte sind Forschungsdateninfrastrukturen, die automatische semantische Verarbeitung von Text und Anwendungen des Text Mining u.a. in den Digital Humanities. Sein Buch zum Text Mining (Neuauflage 2022) ist das deutsche Standardlehrbuch zu diesem aktuellen Thema. An der SAW leitet er als PI u.a. das von ihm mitdefinierte NFDI-Projekt Text+ und vertritt die SAW in den Gremien der Nationalen Forschungsdateninfrastruktur NFDI.

Curriculum Vitae

Gerhard Heyer hat Philosophie, Mathematische Logik und Linguistik an den Universitäten Cambridge (M.A.1980) und Bochum (Dr.phil. 1983) studiert. Daran anschließend hat er einen einjährigen Forschungsaufenthalt zur automatischen Verarbeitung natürlicher Sprache an der University of Michigan, Ann Arbor (USA), als Visiting Assistant Professor und Feodor-Lynen Forschungsstipendiat der Alexander-von-Humboldt Stiftung verbracht.

Lange Jahre war er als Systemspezialist und Leiter von Forschungs- und Entwicklungsaufgaben zu Sprach- und Multimediaprodukten in der Großindustrie und einer eigenen Firma tätig, die eines der ersten Translation Memory Systeme entwickelt hat. An die Universität Leipzig ist er 1994 als einer der ersten Professoren für Automatische Sprachverarbeitung im Fachbereich Informatik berufen worden. Grundlegender Forschungsansatz der Abteilung war dabei stets ein datengetriebener Ansatz sowie eine enge Verbindung von Daten und Verfahren.

Gremien

Prof. Heyer ist Mitglied in zahlreichen wissenschaftlichen Beiräten und Beisitzer im Vorstand des Instituts für Angewandte Informatik (InfAI), einem An-Institut der Universität Leipzig, das er 2006 mitgegründet hat. Von 2016-2021 sowie von 2022-2024 war er Mitglied im Beirat Digitale Wertschöpfung des sächsischen Ministeriums für Wirtschaft und Arbeit (SMWA). Von 1997 bis 2006 war er Mitglied des wissenschaftlichen Beirats des Informationswissenschaftlichen Zentrums (IZ) im GESIS-Verbund, von 2006 bis 2007 auch Mitglied des GESIS-Kuratoriums. Im wissenschaftlichen Beirat des Sorbischen Instituts ist er seit 2015.

Forschungsschwerpunkte

Ausgehend von einer engen Verbindung von Daten und Verfahren liegt ein Schwerpunkt seiner Forschungsarbeiten in dem Aufbau und Betrieb von Forschungsdateninfrastrukturen für die text-orientierten Geistes- und Sozialwissenschaften, wie sie im NFDI-Projekt Text+ erarbeitet werden (vgl. https://text-plus.org/). Grundlage seiner Arbeiten an der SAW sind das Projekt Deutscher Wortschatz, das eine der umfassendsten lexikalischen Ressource fürs Deutsche und viele andere Sprachen darstellt (https://wortschatz.uni-leipzig.de/de). Auf der Verfahrensseite ist sein Forschungsschwerpunkt die automatische semantische Verarbeitung von Text. Neben zahlreichen Veröffentlichungen zu diesem Thema – u.a. dem deutschsprachigen Text Mining Lehrbuch „Text Mining: Wissensrohstoff Text“ (W3L-Verlag, 32011, Überarbeitung bei Springer Campus 2022) – hat er in diesem Bereich auch eine Vielzahl von Forschungsprojekten durchgeführt. Unter den neueren Projekten sind besonders hervorzuheben seine Arbeiten zur Generierung von kleinen, effizienten und domänenspezifischen Sprachmodellen (u.a. CORAL, https://coral-nlp.github.io/index_en.html) sowie der Nutzung von Sprachmodell basierten Verfahren in u.a. juristischen und journalistischen Anwendungen (u.a. https://www.mfrr.eu/monitor/).