\documentclass{article} \usepackage{textcomp} \usepackage[latin3eo]{inputenc} \usepackage[english,eo]{babel} \begin{document} \centerline{\huge {\sc eo} = Esperanto + \LaTeX\bigskip} \sloppy \catcode`\_=13 \def_#1_{{\sl #1\/}} \noindent \begin{minipage}[t]{0.5\textwidth} \selectlanguage{english} \begin{center} {\large by \it Sergei Pokrovsky}\\ \today \end{center} \begin{abstract} On the basis of Babel and {ML\TeX} packages this collection {\sc eo} implements hyphenation for Esperanto texts in OT1/Latin-3 encoding. The {\LaTeXe} stuff is presented in English, the specialties of the esperantic hyphenation are dealt with in Esperanto. (Thus bilingual typesetting is illustrated.) \end{abstract} \end{minipage} \begin{minipage}[t]{0.5\textwidth} \selectlanguage{eo} \begin{center} {\large de \it Sergio Pokrovskij}\\ \today \end{center} \begin{abstract} Surbaze de la paka^joj Babel kaj {ML\TeX} la kolekto {\sc eo} realigas vortotran^cadon por Esperantaj tekstoj en la kodoj OT1/Latin-3a. La problemaro de {\LaTeXe} estas prezentita en la angla; la esperantologia^joj, en Esperanto. (Tio ilustras dulingvan kompostadon.) \end{abstract} \end{minipage} \selectlanguage{english} \section{Esperanto and \LaTeX} In its early days \TeX\ was very friendly to Esperanto, and the availability of the dotless {\tt\j} character looked as a special favor. Unfortunately in the later evolution this special suitability failed to keep pace with the new developments in the system, especially in the newer fonts; nonetheless {\TeX} and its family are still important for Esperanto. It is especially so because of availability of Ispell for Esperanto and Emacs; _ispell.el_ can ignore the {\TeX} commands and can be taught to skip _otherlanguage_ fragments. With its hyphenation patterns {\sc eo} completes the functionality for word processing in Esperanto. After six years of non-{\TeX}ing I've found many new unfamiliar features in the \TeX{} world; I would appreciate very much advice on a better way to provide an esperantization of the system. \section{Fonts: OT1 + {ML\TeX} = Latin-3} The main problem about hyphenation for Esperanto in {\TeX} is the refusal of the normal {\TeX} processor to hyphenate words with \verb.\accent.s in them; fortunately, a special package {ML\TeX} makes it possible to smuggle accented combinations as simple characters. {ML\TeX} is a part of the recent {\LaTeXe} deliveries; I've tested {\sc eo} with my Web2C~7.3.1 only. The other way to avoid this limitation would be use of a special font, where the esperantic letters are normal simple characters (as it is done for Cyrillic). But I do not know whether such {\TeX} fonts exist or how readily are they available. So I do not know whether my hyphenation can work with other fonts besides the native ``Old Types'' (OT1). It was reported to me that Omega contains all the esperantic letters, and generally it must be a good idea to combine Unicode and \TeX; but so far I have not succeeded in mastering Omega. This is why I've decided to limit this beta version to a Latin-3 extension of OT1. \section{The Input} There are three ways to input esperantic letters: \begin{description} \item[\TeX{} style:] \verb|\^Ce\^ha \^sa\u umman\^ga\^{\j}o| $\longmapsto$ \^Ce\^ha \^sa\u umman\^ga\^{\j}o \begin{description} \item[\mdseries\em advantage:] it is usable outside the scope of {\sc eo} \item[\mdseries\em disadvantage:] it is clumsy and it blocs some Esperanto-oriented features (case change, incomplete hyphenation, spell-checking):\\ \verb.\uppercase{\^ciu\^{\j}a\u{u}de}. $\longmapsto$ \uppercase{\^ciu\^{\j}a\u{u}de};\\ \verb.\lowercase{\^CIU\^JA\u{U}DE}. $\longmapsto$ \lowercase{\^CIU\^JA\u{U}DE} \end{description} \item[Deadkey style:] {\selectlanguage{eo} \verb|^Ce^ha ^sa\u umman^ga^jo| $\longmapsto$ ^Ce^ha ^sa^umman^ga^jo } \begin{description} \item[\mdseries\emph{advantage:}] it provides the most important functionality of {\sc eo};\\ {\selectlanguage{eo}% \verb.\uppercase{e^ho^san^go ^ciu^ja^ude}. $\longmapsto$ \uppercase{e^ho^san^go ^ciu^ja^ude};\\ \verb.\lowercase{E^HO^SAN^GO ^CIU^JA^UDE}. $\longmapsto$ \lowercase{E^HO^SAN^GO ^CIU^JA^UDE} } it is pure ASCII, and does not require special source editor font or keyboard facility; it is common enough in the Esperanto community, e.g. it is understood by spell-checkers and editors \item[\mdseries\emph{disadvantage:}] it is not usable outside the scope of {\sc eo}; it is still clumsy (especially for the keyboards with circumflex at a shift key; and it does not work in verbatim:\\ \selectlanguage{eo} \verb|\verb.^Ce^ha.| $\longmapsto$ \verb|^Ce^ha| \end{description} \item[8-bit Latin-3 characters:] \verb|Ĉeĥa ŝaŭmmanĝaĵo| $\longmapsto$ Ĉeĥa ŝaŭmmanĝaĵo \begin{description} \item[\mdseries\emph{advantage:}] the text is most readable; this encoding is supported by the Esperanto-localized editors, spell-checkers etc.; all the {\sc eo} features are available, including the use in verbatim:\\ {\selectlanguage{eo}\verb|\verb.Eĥoŝanĝo ĉiuĵaŭde.| $\longmapsto$ \verb.Eĥoŝanĝo ĉiuĵaŭde.} \item[\mdseries\emph{disadvantage:}] it requires Esperanto localization of the editor used; it is not usable outside the scope of {\sc eo}. \end{description} \end{description} In any case input of non-esperantic accented letters can be done in the classical \TeX{} style, and the Scandinavian letters which occupy (in Latin-1 or T1) the code slots of the esperantic letters (according to Latin3) are still available in the scope of {\sc eo}, provided that the traditional (and default) encoding _OT1_ is used: \begin{center} {\selectlanguage{eo}% \verb|{\selectlanguage{eo}Eĥoŝanĝo ĉiuĵaŭde \AE\ae\v N\O\o\H U\'Y\'y}| $\longmapsto$ Eĥoŝanĝo ĉiuĵaŭde \AE\ae\v N\O\o\H U\'Y\'y} \end{center} But with the Cork encoding the result is a mess: \begin{center} \selectlanguage{eo}% \fontencoding{T1}\selectfont \verb.e^ho^san^go ^ciu^ja^ude. $\longmapsto$ e^ho^san^go ^ciu^ja^ude;\\ \verb.E^HO^SAN^GO ^CIU^JA^UDE. $\longmapsto$ E^HO^SAN^GO ^CIU^JA^UDE \end{center} Almost all the characters of the Latin-3 character set can be input directly as one-byte codes; thus all the letters of ``Afrikaans, Catalan, English, Esperanto, French, Gallician, German, Italian and Turkish'' (with the notable exception of Maltese). The only exception from Latin-3 is the Maltese crossed H, which would require \verb|\usepackage[T4]{fontenc}| and the African computer modern fonts (fc fonts); the lowercase $ħ$ is available in math mode only (= \verb|\hbar|). \section{The files} The hyphenation patterns are in _eohyph.tex_; besides, I've had to make some changes in _esperant.sty, esperant.ldf_ and _latin3.tex_. Because of copyright requirements the modified files receive _eo$*$_ en their names; which actually is more convenient than _esperant$*$_. So the files are: \begin{description} \item[eo.ldf] Babel's _esperant.ldf_ modified to use the esperantic characters according to Latin-3; also, some caption names are changed according to my more conservative preferences (Appendix $mapsto$ Aldono, not ``Apendico'' which is anatomic only for me, etc.) \item[eo.sty] Babel's _esperant.sty_ modified so as to call _eo.ldf_ rather than _esperant.ldf_ \item[eohyph.tex] the hyphenation patterns for Esperanto \item[latin3eo.def] Inputenc's _latin3.def_ modified to enable ML\TeX's \verb|\charsubdef| and the character attributes of the esperantic letters (\verb|\catcode|, \verb|\uccode|, \verb|\lccode|). \item[readme.dvi] this file (typeset) \item[readme.ltx] this file (\LaTeX{} source) \item[testo.dvi] typeset specimen article using {\sc eo}. \item[testo.ltx] the source of a specimen article using {\sc eo}. \end{description} \section{Install} \begin{enumerate} \item Put the three files, _eohyph.tex, eo.sty, latin3eo.def_ in a place where your \LaTeX{} can see them. \item Find the _language.dat_ file of the Babel (typically it is somewhere about _/usr/local/share/texmf/tex/generic/config/language.dat_) and insert in it the line \begin{verbatim}eo eohyph.tex\end{verbatim} \item Build _latex.fmt_. The actual form of the command depends on your \TeX; in my ``\TeX\ (Web2C 7.3.1) 3.14159'' it takes the form: \begin{verbatim}$ initex --mltex \input 'latex.ltx \dump'\end{verbatim} Then move it in an appropriate place (say\\ \verb|$ mv latex.* /usr/local/share/texmf/web2c/|\\ if you insert it into hierarchy, don't forget to updated the database [the ls-R file] with the _mktexlsr_ command). \end{enumerate} If you do not have the root privileges to put the files to their appropriate locations on the server, you can keep then in your own directory (which must be searched earlier than the standard ones; the extreme case is your work directory). If you cannot use the _--mltex_ option you still would get some advantage from using {\sc eo}, because the words which does not contain accents would still be hyphenated. \section{Usage} To use {\sc eo} from {\LaTeXe} you now may indicate \begin{verbatim} \usepackage[latin3eo]{inputenc} \usepackage[eo]{babel} \end{verbatim} You need _latin3eo_ even if you do not use 8-bit codes. If you want to use the characters{\tt\selectlanguage{eo} £ ¤ ° ² ³ ÷ µ × ½ }in your input, you shall also need \verb|\usepackage{textcomp}| from where _latin3eo_ imports them (they are made available in the text mode and shall use the text companion TS1 font). This document has in its preamble: \begin{verbatim} \documentclass[twocolumn]{article} \usepackage{textcomp} \usepackage[latin3eo]{inputenc} \usepackage[english,eo]{babel} \begin{document} \end{verbatim} See also the source of this text and the specimen _testo.ltx_ in this collection. \selectlanguage{eo} \section{Lingvaj aspektoj} \subsection{Pri vortotranĉado} La ekzempla dosiero _testo.ltx_ entenas specimenon el la Zamenhofa Proverbaro; ĉi-sube mi prezentas pecon iom pli modernan (de la plumo de k-do Lanti). (Mi ne responsas pri la enhavo kaj lingvaj eraroj de la teksto.) Ĝenerale mi sekvis la rekomendojn de PAG: unue, la principo morfologia; due, la tranĉo "laŭsilaba", kun la prefero por tranĉoj inter najbaraj konsonantoj. Mi ankoraŭ iom hezitas, ĉu prave mi malpermesis tranĉi la sufiksojn en _abo-n-antojn, be-daŭ-r-inda_ ktp? Ĉu tamen permesi _abo-n-an-tojn_? {\small Vi-v-ant-igi Es-pe-r-anton En la pri-es-pe-r-anta ra-por-to ak-ce-p-t-ita de la Li-go de Na-ci-oj oni po-vas legi pri mi-li-o-noj da ler-no-li-broj jam dis-ven-d-itaj en la mon-do. Nu, ni kom-pa-ru la nom-bron de ve-raj prak-ti-k-antoj de es-pe-r-anto kun tiu de ler-no-li-bro-aĉe-t-intoj. Nur abo-n-antoj de es-pe-r-ante re-dak-t-ataj ga-ze-toj indas es-ti kon-si-de-r-ataj ki-el prak-ti-k-antoj de la lin-g-vo. Sci-ante, ke la plej le-g-ataj el-iras ape-naŭ dek-mi-l-ek-zem-ple-re, oni tuj po-vas ek-vi-di, ki-om sen-si-g-ni-fa es-tas la re-zul-to de la ĝis-nu-na pro-pa-gan-do. Ki-el kla-r-igi ti-un be-daŭ-r-indan kon-sta-ton? Mul-taj per-so-noj ler-nis es-pe-r-anton nur pro mo-do, pro ia dan-d-ismo. Ne-ni-am ili kon-sci-is pri la gra-vo de la mond-lin-g-va afe-ro. For-pa-sis la mo-do, aŭ pro ia kaŭ-zo ili plu ne oku-p-iĝis pri la afe-ro. La plej-mul-to el la aĉe-t-intoj de ler-no-li-broj ne ĝis-fun-de ler-nis la lin-g-von. ``Ĝi es-tas ti-el fa-ci-le ler-n-ebla!'' di-ras la tro-ig-em-uloj, k pri tio ne tro-vas ian ĝu-on en le-g-ado de es-pe-r-antaj tek-s-toj. Ti-uj bal-daŭ ĉe-sis in-te-re-s-iĝi pri la mo-v-ado. In-ter-na-ci-istoj ler-nis es-pe-r-anton, ĉar ili opi-ni-is, ke in-ter-na-cia lin-g-vo es-tas in-ter-na-ci-ig-ilo. Sed ne tro-v-ante oka-zon apli-ki prak-ti-ke sian sci-on, ili an-kaŭ for-la-sis niajn vi-cojn. La ri-d-inda, fi-re-li-gi-eca spi-ri-to, kiu an-taŭ-mi-li-te ĉiam pre-zi-dis en es-pe-r-antaj ma-ni-fe-s-ta-ci-oj, for-pe-lis kelkajn re-vo-lu-ci-ulojn, ki-uj ne vo-lis par-to-pre-ni en mo-v-ado as-pek-t-anta ki-el kva-zaŭa ``Sal-var-meo''. Ali-aj kaŭ-zoj ek-zi-s-tas, ki-uj an-kaŭ po-vus res-pon-di al la ĉi-supre sta-r-ig-ita de-man-do. Ki-aj ajn es-tas la ti-a-loj, ki-uj mal-hel-pis la en-plan-t-iĝon de es-pe-r-anto en la vi-vo, oni ne po-vas mal-a-ten-ti la fak-ton, ke, mal-graŭ dis-ven-d-ado de mi-li-o-noj da ler-no-li-broj, la nom-bro de ve-raj prak-ti-k-antoj es-tas an-ko-raŭ tre mal-gran-da. Ta-men, nur prak-ti-k-antoj de lin-g-vo igas ĝin vi-v-anta: La-ti-non ĉiu-ta-ge k de-v-ige ler-nas mi-li-o-noj da stu-den-toj en la tu-ta mon-do. Spi-te tio la-ti-no re-s-tas nur mor-t-inta lin-g-vo, ti-al ke ĝi ne es-tas uz-ata en la prak-ti-ko. Ni do unue de-vas ple-ne kon-scii pri la ne-pra ne-ce-so de of-ta uz-ado de es-pe-r-anto, por el-iri, al-me-naŭ spi-ri-te, el la ka-dro de nia na-cio, -- ce-le al tut-mon-da kul-tu-ro. Ni de-vas ĝis-fun-de ler-n-adi nian lin-g-von por ĝui ĝi-an spi-ri-ton k ĝin vi-v-ant-igi per novaj es-prim-ma-ni-e-roj. Uzi es-pe-r-anton, ne fa-r-ante gra-ma-ti-kajn era-rojn es-tas nur ak-ce-so-r-aĵo. Kio gra-vas, tio es-tas en-cer-b-igi, en-men-s-igi la ge-ni-econ de la ra-cia es-pri-m-ilo, ki-un kre-is Za-men-hof. Kaj pre-ci-pe ĉiuj SAT-anoj de-vas ler-te pe-n-adi por ke nia or-ga-ni-zo ebl-igu al ĉiuj ma-te-ri-a-lan uti-l-ig-adon de es-pe-r-anto. La ĝis-nu-na pre-s-kaŭ nur var-ba pro-pa-gan-do si-mi-lis la mi-to-lo-gi-an ba-re-lon de la Da-na-id-inoj. Oni var-bis, var-b-adis, sed la var-b-itoj nur trans-pa-sis la sen-fun-dan es-pe-r-antan mo-v-adon. Mi es-pe-ras, ke fi-ne ĉiuj se-ri-o-z-uloj aten-tos pri la fak-toj; kom-pre-nos, ke nia afe-ro es-tos so-li-da nur ki-am la aĉe-t-intoj de gra-ma-ti-koj ne for-la-sos es-pe-r-anton post kelka tem-po, sed en-vi-c-iĝos en SAT por uti-l-igi sian ler-nan aki-r-aĵon. Al ĉiuj var-b-itoj ni kom-pre-n-igu, ke ili kun-tre-nas na-ci-ecan he-re-d-aĵon, ki-un ne-ce-sas for-ĵe-ti per ki-el eble plej of-ta uz-ado de sen-na-ci-eca lin-g-vo kun ĉiu-lan-daj sam-ce-la-noj. Es-pe-r-anto es-tu en niaj ma-noj tra-fa edu-k-ilo, kiu igos nin indaj mond-ci-vi-t-anoj. Ti-e-le ĝi fa-r-iĝos ve-re vi-v-anta lin-g-vo, kiu kre-os mond-kul-tu-ron, sen-na-ci-ecan spi-ri-ton, -- k hel-pos al la ru-i-n-igo de la land-li-moj; al la for-igo de la ha-lad-za pa-tri-o-t-ismo mor-t-iga.} \subsection{Pri la rubriknomoj} Ne ĉiuj ŝanĝoj en _eo.sty_ ŝuldatas al la neceso realigi vortodividadon. Du el ili esprimas miajn lingvajn preferojn. Precipe unu el la tradukoj en _esperant.sty_ impresis min tre malagrable: \begin{verbatim} \def\appendixname{Apendico} \end{verbatim} Jes, tio konformas al PIV, sed tio estas unu el la nemaloftaj okazoj kiam la PIV-a difino vekas en mi vivan proteston. La neoficiala vorto ``apendico'' ja estas internacia, sed precipe en sia senco anatomia. Interalie, nur tiun sencon ĝi havas en la rusa (kaj aliaj nelatinidaj lingvoj). Tial ĝia apero en la senco ``Aldona, akcesora parto, en la fino de verko, libro aŭ dokumento'' impresas almenaŭ strange; same strange kiel nomi aldonan libroparton hepato, reno aŭ klaviklo. Mi eĉ dirus ke sendi leganton en tian mukan vermosimilan intestan elkreskaĵon estus malĝentilaĵo. Mi komprenas ke la vorto havas alian etimologion, ``alpendaĵo'', kiel la germana Anhang; tia vorto sufiĉe trafe priskribas la anatomiaĵon, kaj estas tute maltrafa por libroparto: el zorge bindita libro ne pendas iaj kromaĵoj. Resume, mi opinias tion klasika okazo kiam vorton, akceptitan pro iu internacia signifo, oni ekuzas ankaŭ kun la neinternaciaj signifoj kiujn ĝi havas en la fonta(j) lingvo(j). La perfida ``internaciismo''. La normala Esperanta vorto estus por mi ``Aldono''. Tiun vortoj multaj uzas sponte (kun plezuro mi vidis ke en PMEG la afero estas nomata _Aldonoj_) kaj ĝi respondas al la tradicio de multaj lingvoj (mi faris \verb.`grep \appendix *`. en la koncerna Lateĥa dosierujo): \begin{verbatim} | croatian {Dodatak} | czech {Dodatek} | estonian {Lisa} | lsorbian {Dodawki} | polish {Dodatek} | slovak {Dodatok} | slovene {Dodatek} | ukraine Dodatok | usorbian {Dodawki} \end{verbatim} La rusa uzas ``Priloĵenie'', proksimume ``almetaĵo'' aŭ ``ĉemeto'', kiu similas la germanan ``Beilage'' aŭ \begin{verbatim} | finnish {Liite} (t.e. ``alfiksaĵo'') | danish {Bilag} | dutch {B"ylage} | norsk {Tillegg} or Appendiks | russian Prilo^jenie | swedish {Bilaga} \end{verbatim} kaj iom al \begin{verbatim} | french {Annexe} | romanian {Anexa} \end{verbatim} Mi ne scias la ideon de \begin{verbatim} | bahasa {Lampiran} | breton {Stagadenn} | greek {Par'arthma} | irish {Aguis\'{\i}n} | magyar {F\"uggel\'ek} | scottish {Ath-sgr`{\i}obhadh} | turkish {Ek} | welsh {Atodiad} \end{verbatim} kaj por fini mi listigu la latinidajn \begin{verbatim} | catalan {Ap\`endix} | english {Appendix} | galician {Ap\'endice} | italian {Appendice} | portuges {Ap\^endice} | spanish {Ap\'endice} \end{verbatim} Kiel mi jam diris, ``Apendico'' estas por mi malakcektebla en la libra senco; sed mi ankaŭ povas imagi ke la naiva ``Aldono'' povas kaŭzi problemojn en la frazoj kiel \begin{quote} ``la Oficialaj Akademiaj Aldonoj 3--5 estas troveblaj en la Aldono 4a de nia libro''. \end{quote} Evidente, oni ĉiam povas iel elturniĝi, sed eble estas pli bona solvo? (Kvankam por mi evidentas ke la ``natura'', memtrudiĝanta vorto esperanteca por tiu afero estas ``Aldono''.) \end{document} \endinput pri ML\TeX: http://tug.cs.umb.edu/web2c/manual/web2c_28.html