A, to jest coś, czego właśnie szukałem. Pojawia się to jako pierwszy link w google po wpisaniu "frequency of latin words", ale nie przyszło mi do głowy, żeby to wpisać.R. K. Miller pisze: Dysertacja dra Diedericha jest pod adresem: http://users.erols.com/whitaker/freq.htm , a tutaj można sobie ćwiczyć słownictwo: http://www.edonnelly.com/latin/vocabBasic.html .
Dodam tylko garść własnych obserwacji.
Np. taka Vulgata ma ponad 0.5 mln słów. Z tego słów różnych jest ponad 40 tysięcy (jeżeli każdą formę fleksyjną liczyć jako osobne słowo). Jeżeli różne formy fleksyjne liczymy jako to same słowo, mamy ok. 11 tys różnych słów (w sensie różnych "haseł słownikowych").
Jeżeli teraz uszeregujemy wszystkie słowa (w sensie "hasła słownikowe") wg częstości występowania, to - zadziwiająco - wystarczy znać ok. 2 tys. najczęściej występujących haseł słownikowych, aby pokryć 95% tekstu Vulgaty.
Dla porównania - w przypadku Commentarii de Bello Gallico, wystarczy ok. 1800 najczęściej występujących słow (znów w sensie haseł słownikowych), aby pokryć 95% tekstu.
Jak widać, 2000 i 1800 to bardzo podobne liczby, a przecież Vulgata i Commentarii to zupełnie inne teksty, inny styl, inne słownictwo,
nawet zupełnie inna długość tekstu.
Dlatego wydaje mi się, że coś ciekawego dzieje się w ludzkim mózgu w momencie, kiedy osiągnie się znajomośc pewnej progowej liczby słów - następuje jakościowy skok w rozumieniu języka.