logo

/

Periodicals

/

Prispevki za novejšo zgodovino

Structural and Semantic Classification of Verbal Multi-Word Expressions in Slovene


Co-author(s):Jure Gašparič (gl. ur.)
Leto:2019
Publisher(s):Inštitut za novejšo zgodovino, Ljubljana
Language(s):angleščina
Type(s) of material:text
Rights:
CC license

This work by Polona Gantar, Špela Arhar Holdt, Jaka Čibej, Taja Kuzman is licensed under Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International

Files (1)
Name:PNZ_1_2019_web.pdf
Size:2.47MB
Format:application/pdf
Open
Download
Description
This paper is an extended version of a conference paper presenting the categorization of verbal multi-word expressions (VMWEs) according to the PARSEME COST Action Shared Task 1.1 Guidelines. The categorization is universal but takes into account the characteristics of the individual languages included in it. The Shared Task was used to annotate over 13,000 sentences of the Slovene ssj500k 2.0 training corpus, which resulted in nearly 3,400 identified VMWEs categorized as inherently reflexive verbs, light verb constructions, inherently adpositional verbs, and verbal idioms. The paper presents both the quantitative and qualitative results of the analysis, compares the suggested categorization system to existing work on VMWEs in Slovene linguistics, and evaluates the use of the proposed system for future work.
Metadata (11)
  • identifierhttps://hdl.handle.net/11686/44938
    • title
      • Structural and Semantic Classification of Verbal Multi-Word Expressions in Slovene
    • creator
      • Polona Gantar
      • Špela Arhar Holdt
      • Jaka Čibej
      • Taja Kuzman
    • contributor
      • Jure Gašparič (gl. ur.)
    • subject
      • glagolske zveze
      • korpusni pristop
      • večbesedne enote
      • PARSEME
      • slovenščina
      • verb phrases
      • corpus approach
      • multi-word expressions
      • Slovene
    • publisher
      • Inštitut za novejšo zgodovino
    • date
      • 2019
      • 01. 01. 2019
    • type
      • besedilo
    • language
      • Angleščina
    • isPartOf
    • rights
      • license: ccByNcSa
    Seznam literature v delu (25)
    StranAvtorNaslovVirKrajZaložbaLeto
    Arhar Holdt, Špela ; Gorjanc, VojkoKorpus FidaPLUS: nova generacija slovenskega referenčnega korpusaJezik in slovstvoLjubljanaSlavistično društvo Slovenije2007
    Atkins, Beryl T. Sue ; Rundell, MichaelThe Oxford Guide to Practical LexicographyOxford ; New YorkOxford University Press2008
    Baldwin, Timothy ; Kim, Su NamMultiword ExpressionsHandbook of Natural Language ProcessingBoca RatonCRC Press2010
    Breznik, AntonSlovenska slovnica za srednje šoleCelovecDružba sv. Mohorja1916
    Breznik, AntonSlovenska slovnica za srednje šoleCeljeDružba sv. Mohorja1934
    Dobrovoljc, KajaMulti-word discourse markers and their corpus-driven identification : the case of MWDM extraction from the reference corpus of spoken SloveneInternational journal of corpus linguisticsAmsterdam ; PhiladelphiaJohn Benjamins Publishing Company2017
    Dobrovoljc, Kaja ; Krek, Simon ; Rupnik, JanSkladenjski razčlenjevalnik za slovenščino = Dependency parser for SloveneZbornik Osme konference Jezikovne tehnologije, 8. do 12. oktober 2012, [Ljubljana, Slovenia] : zbornik 15. mednarodne multikonference Informacijska družba - IS 2012, zvezek CLjubljanaInstitut Jožef Stefan2012
    Gantar, Polona ; Colman, Lut ; Parra Escartín, Carla ; Alonso, Héctor MartínezMultiword expressions : between lexicography and NLPInternational journal of lexicographyOxfordOxford University Press2018
    Gantar, Polona ; Arhar Holdt, Špela ; Čibej, Jaka ; Kuzman, Taja ; Kavčič, TejaGlagolske večbesedne enote v učnem korpusu ssj500k 2.1Zbornik konference Jezikovne tehnologije in digitalna humanistika, 20. september - 21. september 2018, Ljubljana, SlovenijaLjubljanaZnanstvena založba Filozofske fakultete2018
    Gantar, Polona ; Krek, Simon ; Kuzman, TajaVerbal multiword expressions in SloveneComputational and corpus-based phraseology : proceedingsChamSpringer
    Godec Soršak, LaraGlagoli z oslabljenim pomenom v Slovarju slovenskega knjižnega jezikaSlavistična revija : časopis za jezikoslovje in literarne vedeLjubljanaSlavistično društvo Slovenije2013
    Grčar, Miha ; Krek, Simon ; Dobrovoljc, KajaObeliks : statistični oblikoskladenjski označevalnik in lematizator za slovenski jezikZbornik Osme konference Jezikovne tehnologije, 8. do 12. oktober 2012, [Ljubljana, Slovenia] : zbornik 15. mednarodne multikonference Informacijska družba - IS 2012, zvezek CLjubljanaInstitut Jožef Stefan2012
    Krek, Simon ; Dobrovoljc, Kaja ; Erjavec, Tomaž ; Može, Sara ; Ledinek, Nina ; Holz, Nanika ; Zupan, Katja ; Gantar, Polona ; Kuzman, TajaTraining corpus ssj500k 2.0LjubljanaSlovenian Language Resource Repository CLARIN.SI2017
    Kržišnik, ErikaSlovenski glagolski frazemi : ob primeru frazemov govorjenja : doktorska disertacijaLjubljanasamozal.1994
    Metelko, Franc SerafinLehrgebäude der slowenischen Sprache im Königreiche Illyrien und in den benachbarten Provinzen : nach dem Lehrgebäude der böhm. Sprache des Hrn. Abbé DobrowskyLaibachgedruckt bey Leopold Eger1825
    Ramisch, Carlos ; Cordeiro, Silvio Ricardo ; Savary, Agata ; Vincze, Veronika ; Mititelu, Verginica Barbu ; Bhatia, Archna ; Buljan, Maja ; Candito, Marie ; Gantar, PolonaEdition 1.1 of the PARSEME shared task on automatic identification of verbal multiword expressionsProceedings : LAW-MWE-CxG 2018Santa Fes.n.2018
    Sag, Ivan ; Baldwin, Timothy ; Bond, Francis ; Copestake, Ann ; Flickinger, DanMultiword Expressions : a Pain in the Neck for NLPProceedings of the 3rd International Conference on Intelligent Text Processing and Computational Linguistics (CICLing 2002)Berlin ; Heidelberg ; New YorkSpringer2002
    Schneider, Nathan ; Onuffer, Spencer ; Kazour, Nora ; Danchik, Emily ; Mordowanec, Michael T. ; Conrad, Henrietta ; Smith, Noah A.Comprehensive annotation of multiword expressions in a social web corpusProceedings of the Ninth International Conference on Language Resources and Evaluation (LREC-2014)European Languages Resources Association (ELRA)2014
    Toporišič, JožeK izrazju in tipologiji slovenske frazeologijeJezik in slovstvoLjubljanaSlavistično društvo Slovenije1974
    Toporišič, JožeNova slovenska skladnjaLjubljanaDržavna založba Slovenije1982
    Toporišič, JožeSlovenska slovnicaMariborObzorja2000
    Vidovič Muha, AdaPomenski preplet glagolov imeti in biti - njuna jezikovnosistemska stilistikaSlavistična revija : časopis za jezikoslovje in literarne vedeLjubljanaSlavistično društvo Slovenije1998
    Žele, AndrejaVezljivost v slovenskem knjižnem jeziku (s poudarkom na glagolu) : doktorska disertacijaLjubljanasamozal.1999
    Žele, AndrejaProstomorfemski glagoli kot slovarska geslaJezikoslovni zapiski : zbornik Inštituta za slovenski jezik Frana RamovšaLjubljanaInštitut za slovenski jezik Frana Ramovša ZRC SAZU2002
    Žele, AndrejaPomensko-skladenjske lastnosti slovenskega glagolaLjubljanaZaložba ZRC, ZRC SAZU2012