Záměrem projektu je - v návaznosti na výsledky projektu "Možnosti a meze gramatiky češtiny ve světle Českého národního korpusu" (dále MaM) - v relativní úplnosti popsat co největší množství problémových jevů z gramatiky současné spisovné češtiny, a to z oblasti formální morfologie, sémantické morfologie, způsobů nominace (zejména slovotvorby), syntaxe jmenné skupiny, klauze, věty a textu. Tento popis by měl být publikován jako kniha názvu identického s názvem projektu ("Kapitoly z české gramatiky") a měl by být základem a podstatnou součástí budoucí velké akademické "Gramatiky současné češtiny". Tento popis by měl poprvé v dějinách české lingvistiky cele vycházet ze systematického několikaletého studia jevů české gramatiky týmem specialistů, jejichž předmětem studia je reprezentativní, pro dané badatelské účely maximálně rozsáhlá jednotná materiálové báze. Takovou bází jsou texty Českého národního korpusu.
Předmětem tohoto popisu bude systémový status, gramatičnost, žánrová distribuce, stylová hodnota a frekvenční distribuce těch gramatických forem a struktur, které byly evidovány během projektu MaM a uloženy do příslušných projektových databází. Jsou to:
(a) jevy značně frekventované, které navzdory tomu nebyly dosud v gramatikách představeny buď vůbec, anebo jen neúplně či nahodile nebo byl nahodile a s nedostatečným množství příkladů zhodnocen jejich systémový a funkční status, neboť před existencí korpusů nebylo možno dané jevy studovat v potřebném množství textů;
(b) jevy málo frekventované, mezní a řídké nebo sporné, jejichž popis dosud buď zcela schází, anebo je neúplný, nahodilý či mylný vzhledem k tomu, že - ve srovnání s nynějšími možnostmi - vycházel z velmi omezeného jazykového materiálu nebo je plodem subjektivního náhledu lingvistova;
Obecná charakteristika zamýšleného projektu
Projekt je koncipován jako strukturovaná týmová práce především na tvorbě popisu typických monopolních i konkurenčních gramatických forem a struktur soudobé češtiny, včetně vybraných forem a struktur periferních, vzhledem k tomu, jak jsou či nejsou obsaženy v elektronických textových databázích. Základním zdrojem bude Český národní korpus, a to z největší části SYN 2000. Jako korektiv a doplněk bude využíván chystaný SYN 2005; zčásti budou materiálovou základnou výzkumu a popisu i ostatní korpusy a anotované soubory textů soudobé češtiny, zejména Pražský závislostní korpus. Jako doplňkové zdroje budou v jednotlivých případech sloužit také internetové vyhledávače (Morfeo, Google aj.).
Projekt nezahrnuje popis fonologie, fonetiky a intonace, neboť tyto jevy nelze na dosavadních korpusech systematicky studovat. Uvažujeme naopak o zpracování pravopisu; není to sice jev gramatický, ale mnohé pravopisné jevy s gramatikou úzce souvisejí a materiálová báze takový popis umožňuje.
Obecné metodologické aspekty projektu
Projekt takto zaměřený předpokládá spolupráci lingvistů ochotných pozorně studovat, analyzovat a vyhodnocovat velké množství dokladů mnoha z více než tisíce dílčích gramatických jevů uložených v databázích projektu MaM, na nějž tento projekt má navázat.
Tyto analýzy a tato hodnocení ovšem nelze provádět bez znalosti dosavadních poznatků a postulátů o gramatice češtiny. Ty bude naopak třeba respektovat jako jedno z teoretických východisek analýzy a popisu, při němž půjde i o to, dosavadní postuláty a tvrzení analýzou nalezených dokladů potvrdit, doplnit, nebo vyvrátit. I k této široce koncipované resumující teoretické práci je zapotřebí spolupráce řady lingvistů, specialistů v dílčích oblastech české, obecné i srovnávací gramatiky.
Pokud jde o návaznost projektu na dosavadní výsledky bádání o gramatice češtiny, základnou k tomu budou publikované gramatiky a syntaxe češtiny od Trávníčka, Havránka-Jedličky, Šmilauera, Kopečného a Grepla-Karlíka, akademická Mluvnice češtiny, výsledky badatelské práce F. Daneše a dalších předních českých gramatiků a v neposlední řadě výsledky badatelské práce kolektivu Sgall-Hajičová-Panevová (viz seznam literatury na konci tohoto zdůvodnění); tyto výsledky bádání o gramatice češtiny se právě analýzou korpusu zevrubně ověřují.
Pokud jde o obecné aspekty gramatiky, bude využito zejména skvělých výsledků anglických korpusových gramatik. Pokud jde o gramatiky kontrastivní, bude možno se mj. opřít o Česko-německou srovnávací gramatiku navrhovatele projektu, kterou vydalo nakl. Argo v r. 2003. Tato díla nijak nezkracují a nezjednodušují práci na chystaném projektu, o jehož institucionálně-finanční podporu žádáme. Naopak: tato díla neustále nově a stále více vyjevují obrovskou variabilitu přirozeného jazyka, která nejenže plně nepodléhá libovůli a rozmarům individuálních mluvčích, ale je naopak ovládána takovým množstvím pravidel či pravidelností a tendencí, které dosud sotva dokážeme dohlédnout či odhadnout.
Dílčí metodologické kroky projektu
V prvním roce projektu budou jednak individuálně, jednak v rámci týmové práce v seminářích a workshopech hodnoceny výsledky korpusové evidence gramatických jevů, které byly sledovány v rámci projektu MaM, a budou z nich vybrány ty, které se stanou předmětem detailního popisu v Kapitolách z české gramatiky.
Během celé doby trvání projektu průběžně a paralelně s tvorbou textu Kapitol bude rozpracovávána metodologie popisu, zejména vzhledem k empirické i teoretické koherenci jevů z různých oblastí jazykového systému (viz strukturu kapitol níže), a v případě potřeby bude navržená struktura kapitol korigována.
Popis bude rozvržen do těchto hlavních kapitol (jde o výběr problematických jevů):
SLOVO
I. MORFOLOGICKÁ VARIANTNOST (variantní pádové tvary substantiv, sloves a číslovek)
II. VÝZNAMY MORFOLOGICKÝCH KATEGORIÍ (VID, ČAS, MODUS, PÁD, ROD, ČÍSLO)
III. TVOŘENÍ SLOV (substantivní deriváty s nejfrekventovanějšími sufixy; neproduktivní typy nominace)
IV. VALENCE
KLAUZE (Základová predikační větná struktura)
I. SYNTAKTICKÉ STRUKTURY KLAUZE (Typy predikace; struktury s pasívem; vybrané jevy valence)
II. SLOVOSLED (vybrané jevy: např. některé typy fokusace; pozice tématu a rématu; slovosled klitik)
III. KONGRUENCE
MEZI KLAUZÍ A SOUVĚTÍM ("POLOVĚTNÉ" STRUKTURY NOMINALIZAČNÍ)
SOUVĚTÍ
I. SÉMANTICKÉ TYPY SOUVĚTNÝCH VZTAHŮ (vybrané typy)
II. SLOŽITÉ SOUVĚTÍ (s bezprostřední posloupností dvojice konektorů)
III. SOUHRA ČASU A VIDU ve větě řídící a závislé
TEXT
I. PROSTŘEDKY KOREFERENCE
II. LEXIKÁLNÍ PROSTŘEDKY KOHEZE (konektory)
III. VZTAHY VÝPOVĚDÍ V TEXTU
IV. INDIKÁTORY ILOKUCE
V. VÝRAZY KONTAKTOVÉ
Význam projektu pro praxi a výstup projektu
Hlavním výstupem projektu má být - kromě dílčích studií a referátů přednesených na konferencích - knižní dílo asi o tisíci stranách s názvem totožným s názvem projektu, tj. "Kapitoly z české gramatiky". Mají v něm být registrovány a co nejdetailněji popsány a vysvětleny z hlediska systémového i komunikativního vybrané problémové jevy z uvedených oblastí gramatiky.
Vzhledem k tomu, že tato dílčí gramatika problémových jevů bude poskytovat - vzhledem k rozsáhlé a historicky zcela bezprecedentní empirické bázi výzkumu - údaje o gramatičnosti, frekvenční a žánrové distribuci i stylové hodnotě tvarových variant prvků morfologických paradigmat, syntaktických struktur frázových, větných a textových i struktur slovosledných, bude moci být spolehlivým zdrojem:
(a) informací o problémové části systému gramatiky současné češtiny, jak se odráží v úzu reprezentovaném Českým národním korpusem; tyto informace budou určeny vzdělané veřejnosti;
(b) argumentů při hodnotících soudech a preskriptivní poradenské a osvětové činnosti Ústavu pro jazyk český AV ČR i jiných bohemistických jazykovědných pracovišť;
(c) podkladů pro tvorbu učebnic a gramatik češtiny pro Čechy i cizince;
(d) poznatků využitelných v informačních technologiích.
V "Kapitolách" bude zájemcům (jakými jsou především studenti, učitelé, novináři a spisovatelé) poskytnuta soustava objektivně podložených výkladů o přirozeně existujících a respektovaných i doporučovaných normách a pravidlech při výběru tvarů slov a tvorbě složených pojmenování, vět a celého textu.
Základní referenční literatura:
1. Mluvnická díla
(uspořádáno chronologicky)
Šmilauer, V.: Novočeská skladba. 1. vyd. Praha 1947.
Trávníček, F.: Mluvnice spisovné češtiny I, II. Praha 1951.
Havránek, B.-Jedlička, A.: Česká mluvnice. 1. vyd. Praha 1952.
Kopečný F.: Základy české skladby. SPN Praha 1958. Mluvnice češtiny I-III. Praha: Academia, 1986-1987. Příruční mluvnice češtiny. (kol. autorů ÚČJ FF MU). Praha: Lidové noviny, 1995.
Čechová, M. a kol: Čeština-řeč a jazyk. Praha 1996.
Grepl. M.-Karlík, P.: Skladba češtiny. Olomouc: Votobia, 1998.
Štícha, F.: Česko-německá srovnávací gramatika. Praha: Argo, 2003.
2. Knižní monografie
Běličová, H.: Sémantická struktura věty a kategorie pádu. Praha: Academia 1982.
Daneš, F.: Věta a text. Praha: Academia 1985.
Daneš, F.-Hlavsa, Z. a kol.: Větné vzorce v češtině. Praha: Academia 1987.
Daneš, F.-Dokulil, M.-Kuchař, J. a kol.: Tvoření slov v češtině II. Odvozování podstatných jmen. Praha: Academia 1967.
Dokulil, M.: Tvoření slov v češtině I. Teorie odvozování slov. Praha: Academia 1962.
Dvořák E.: Přechodníkové konstrukce v nové češtině. Praha: UK 1983.
Hajičová, E.: Negace a presupozice ve významové stavbě věty. Praha: Academia 1975.
Hlavsa, Z.: Denotace objektu a její prostředky v současné češtině. Praha: Academia 1975.
Hrabě, V: Polovětné vazby a kondenzace "druhého sdělení" v ruštině a češtině. Praha 1964.
Kopečný, F.: Slovesný vid v češtině. Praha: ČSAV 1962.
Panevová, J.: Formy a funkce ve stavbě české věty. Praha: Academia 1980.
Panevová, J.-Benešová, E.-Sgall, P.: Čas a modalita v češtině. Praha 1971.
Piťha, P.: Posesivní vztah v češtině. Praha 1992.
Sgall, P.-Hajičová, E.-Buráňová, E.: Aktuální členění věty v češtině. Praha: Academia 1980.
Sgall, P.-Hajičová, E.-Panevová, J.: The Meaning of the Sentence in Its Semantic and Pragmatic Aspects. Prague, Academia a Dordrecht, Reidel 1986.
Štícha, F.: Utváření a hierarchizace struktury větného znaku. Praha: UK 1984.
Uhlířová, L.: Knížka o slovosledu. Praha: Academia 1987.
Zimová, L.: Způsoby vyjadřování větných členů v textu. Konkurence pojmenování, pronominalizace a elize. Ústí nad Labem 1994.
3. Korpusově orientované studie (výběr)
Bermel, N. (2004): V korpuse nebo v korpusu? Co nám řekne (a neřekne) ČNK o morfologické variaci v tvarech plurálu. In Hladká, Z.- Karlík, P. (eds): Čeština - univerzália a specifika 5, Sborník z konference v Brně 13.-15.11. 2003, Praha: Lidové noviny, 163-171.
Čermák, F. (1995): Jazykový korpus: Prostředek a zdroj poznání. SaS, 56, 119-140.
Čermák, F. (2004): Jazyková variabilita: případ přísloví. In Hladká, Z.- Karlík, P. (eds.): Čeština - Univerzália a specifika 5, Sborník z konference v Brně 13.-15.11. 2003, Praha: Lidové noviny, 99-109.
Čermák, F. (2004): Modality in Czech and English. Possibility particles and the conditional mood in a parallel corpus, IJCL 9:1, 83-95.
Esvan, F. (2004): Habitude, répétition et aspect du verbe en tcheque: contextes avec několikrát, AION Slavistica VI, 29-41.
Esvan, F. (2004): Budoucí čas a vid v češtině: několik poznámek na základě korpusových dat. In Hladká, Z.- Karlík, P. (eds.): Čeština - Univerzália a specifika 5, Sborník z konference v Brně 13.-15.11. 2003, Praha: Lidové noviny, 136-142.
Esvan, F. (2005): Vidová opozice v kontextu, In Karlík, P (ed.): Korpus jako zdroj dat o češtině, Brno:MU, 63-69.
Hajič J. (1998): Building a Syntactically Annotated Corpus: The Prague Dependency Treebank. In Hajičová, E. (ed.): Issues of Valency and Meaning, Praha: Karolinum, 106 - 132.
Hajič, J.-Hajičová, E.-Panevová, J.-Sgall, P. (1998): Syntax v českém národním korpusu, SaS, 59, 168-177.
Kolářová, I. (2004): Deiktická zájmena v mluvnických pracích, jejich výskyt, užití a význam v textech reálné komunikace. In Balowski, M.- Svoboda, J. (eds.): Stalość i zmienność w języku i literaturze czeskiej XX. wieku - Konstanty a proměny v českém jazyce a literatuře XX. století. Tom referatów z międzynarodowej konferencji naukowej, Wałbrzych - Ostrava: Państwowa Wyzsza Szkoła Zawodowa w Wałbrzychu - Ostravská univerzita, 127-134.
Kolářová, I. (2004): Frazeologické výrazy s nereferenčně užitým slovem to. In: Sborník prací FF OU věnovaný životnímu jubileu prof. PhDr. Jaroslava Hubáčka, CSc., a doc. PhDr. Naděždy Bayerové, CSc., Ostrava: Ostravská univerzita, Filozofická fakulta, 263-272.
Kolářová, I. (2004): Významy slova to v navazovací platnosti v textech Českého národního korpusu. In: Karlík, P (ed.): Korpus jako zdroj dat o češtině, Brno: MU, 165-173.
Obrovská, J. (2002): Přechod feminin od vzoru "kost" ke vzoru "píseň" v materiálu Českého národního korpusu. Naše řeč, 85, 79-89.
Obrovská, J. (2003): K přechodu feminin od vzoru "kost" ke vzoru "píseň". In: SPFFBU A 51. Brno: MU, 147-159.
Obrovská, J. (2003): Centrum a periférie v deklinaci feminin (na materiálu Českého národního korpusu). In: Okraj a střed v jazyce a literatuře. Sborník z mezinárodní konference. Ústí nad Labem: UJEP, 109-115.
Obrovská, J. (2004): Co může (a nemůže) prozradit korpus o tzv. kolísání mezi "vzory" kost a píseň u apelativních feminin. In Blatná, R.- Petkevič, V. (eds): Jazyky a jazykověda. Sborník k 65. nar. prof. PhDr. F. Čermáka, DrSc., Praha: FF UK- UČNK, 313-336.
Petkevič V. (2004): Využití pravidel pro negaci v automatickém značkování českých korpusů. In Hladká, Z.- Karlík, P. (eds.): Čeština - Univerzália a specifika 5, Sborník z konference v Brně 13.-15.11. 2003, Praha: Lidové noviny, 143-150.
Sgall, P.-Hajičová, E.-Panevová, J. (2000): Manuál pro tektogramatické značkování, Tech. Report 7, UFAL/MFF.
Šimandl, J. (2004): Numerativ v současné češtině. In Balowski, M.- Svoboda, J. (eds.): Stałość i zmienność w języku i literaturze czeskiej XX wieku / Konstanty a proměny v českém jazyce a literatuře XX. století. Tom referatów z międzynarodowej konferencji naukowej, Wałbrzych, 15-17 maja 2003, Wałbrzych-Ostrava, 259-267.
Šimandl, J. (2004): Korpus jako (jediný) zdroj? In Hladká, Z.- Karlík, P. (eds.): Čeština - Univerzália a specifika 5, Sborník z konference v Brně 13.-15.11. 2003, Praha: Lidové noviny, 50 57.
Šimandl, J. (2004): Kolísání infinitivu v korpusech a na internetu - pilotáž a sondy. In: Blatná, R.- Petkevič, V. (eds): Jazyky a jazykověda. Sborník k 65. nar. prof. PhDr. F. Čermáka, DrSc., Praha: ÚČNK FF UK,153-169.
Štícha, F. (1997): Komputační korpusy a empirická gramatika. SaS, 58, 26-34.
Štícha F. (2001): Kritéria gramatičnosti (Korpus jako argument a inspirace). SaS, 62, 161-175.
Štícha F. (2004): Sekundární imperfektiva v současné češtině. In: Život s morfémy. Sborník studií na počest Zdenky Rusínové, Brno, 151-160.
Štícha F. (2004): Nominativ a instrumentál predikátového substantiva v současné češtině: sonda do korpusu. SaS, 65, 113-132.
Štícha F. (2004): Thematisierung, Satzanfang und Grammatikalität. Linguistica Pragensia 14/2, 90-103.
Štícha F.(2004): Kataforické korelativum to s větami podmětovými a předmětovými. In Karlík, P. (ed.): Korpus jako zdroj dat o češtině, Brno: MU, 145-153.
Štícha F. (2005): Vztah slovosledu fixního a aktuálního: sondy do ČNK. In: Dolník, J. (ed.), Jazyk a komunikácia v súvislostiach (Zborník príspevkov z medzinárodnej vedeckej konferencie konanej 24. a 25. júna 2004 na Filozofickej fakulte univerzity Komenského v Bratislave), 297-307.