Afbreekpatronen voor het Nederlands
Hoi allemaal, Voor OpenTaal heb ik samen met Simon afgelopen jaar een nieuwe woordenlijst en spellingcontrole gemaakt. Deze zijn te vinden in: - woordenlijst: https://github.com/OpenTaal/opentaal-wordlist - spellingcontrole: https://github.com/OpenTaal/opentaal-hunspell - laatste installeerbare pakketten: https://github.com/OpenTaal/opentaal-beta Nu is het tijd om ook de afbreekpatronen een update te gaan geven. Daarvoor heb ik eerst een van de testen die we gebruiken bijgewerkt, zie https://github.com/OpenTaal/tex-gdictee Dit is een pakket dat Nederlandse dummyteksten bevat. Hoe die worden afgebroken is te zien in bijvoorbeeld https://github.com/OpenTaal/tex-gdictee/blob/master/gdictee/gdictee-test123.... Hier heb ik twee vragen over aan jullie. Is het gewenst om bijvoorbeeld 's ochtends bij elkaar te houden met een non-breaking space? Dat kan weer resulteren in iets lelijks zoals afbreken zo: ... 's och- tends ... Vergelijkbrare vraag voor 's-Hertogenbosch. Is dit prima? ... 's-Her- togenbosch ... Andere vraag is of ik de diakritische tekens nog steeds als \"e moet gebruiken in gdictee.dtx voor legacyredenen of is het momenteel gangbaar om ë te gebruiken? (Dat was in 2013 nog niet het geval.) Alvast bedankt, Pander
On 8/4/2021 3:53 PM, Pander wrote:
Andere vraag is of ik de diakritische tekens nog steeds als \"e moet gebruiken in gdictee.dtx voor legacyredenen of is het momenteel gangbaar om ë te gebruiken? (Dat was in 2013 nog niet het geval.) de afbreekpatronen worden al enige jaren in utf8 afgehandeld dus je kan dat gebruiken ipv \commandos
Hans ----------------------------------------------------------------- Hans Hagen | PRAGMA ADE Ridderstraat 27 | 8061 GH Hasselt | The Netherlands tel: 038 477 53 69 | www.pragma-ade.nl | www.pragma-pod.nl -----------------------------------------------------------------
participants (2)
-
Hans Hagen
-
Pander