[niet-TeX maar wel gerelateerd] conversie UTF-8 tekst naar PDF op linux
Waarde allemaal, Al jaren gebruik ik a2ps -> ps2pdf om source code (meestal FORTRAN, maak ook Python, Octave en soms LaTeX) om te zetten naar PDF. Dat werkt eigenlijk uitstekend - zolang je alleen "single byte encodings" gebruikt. Ik ben bezig met wat programmeerwerk voor een student en het commentaar van de code schrijf ik in het Japans (Japanners en de Engelse taal...... dat blijft toch een heel aparte toestand). De files zijn gecodeerd in UTF-8. Met als gevolg dat a2ps zich verslikt; de "latijnse" karakters komen goed door maar de CJK karakters niet. Dat is een bekend fenomeen voor a2ps. Ik ben dus op zoek naar een vervanging voor a2ps maar dan wel een versie die UTF-8 aankan. Als jullie tips hebben hoor ik het graag. Geprobeerd: u2ps - "a2ps for UTF-8". Werkt uitstekend met Japanse tekst, maar heeft geen syntax highlighting en geen kleuren gnome-u2ps - "a2ps reimplemented with gnome libraries"; geschreven door een Japanner. Laatste update van de source code in 2004, en het compileert op geen van mijn linux machines e2ps - "a2ps implementation for euc-jp". Klinkt goed, maar als ik de source download krijg ik een HTTP 403 "Forbidden" a2psj - een soort Perl-script dat geleverd wordt met sommige linux distributies (Ubuntu, Debian). Ik heb alleen RPM kunnen vinden. Mijn machines zijn Gentoo dus met RPM begin ik niet veel. Eigenlijk geeft gedit een heel goed resultaat, maar met gedit kan je niet printen vanaf de command line. Dus je kan individuele files openen en dan ctrl-p. Ik gebruik meestal een soort scriptje om meerdere source files te converteren en dan te printen naar een PDF file. Via gedit is dus mogelijk maar het moet "met de hand". Je schijnt met OpenOffice te kunnen printen via de command line maar ik neem aan OpenOffice geen syntax highlighting heeft. Help mij ;-)) Groeten,Wilfred
Wilfred van Rooijen schreef:
Waarde allemaal,
Al jaren gebruik ik a2ps -> ps2pdf om source code (meestal FORTRAN, maak ook Python, Octave en soms LaTeX) om te zetten naar PDF. Dat werkt eigenlijk uitstekend - zolang je alleen "single byte encodings" gebruikt.
Ik ben bezig met wat programmeerwerk voor een student en het commentaar van de code schrijf ik in het Japans (Japanners en de Engelse taal...... dat blijft toch een heel aparte toestand). De files zijn gecodeerd in UTF-8. Met als gevolg dat a2ps zich verslikt; de "latijnse" karakters komen goed door maar de CJK karakters niet. Dat is een bekend fenomeen voor a2ps. Ik ben dus op zoek naar een vervanging voor a2ps maar dan wel een versie die UTF-8 aankan. Als jullie tips hebben hoor ik het graag.
Kijk eens naar Pygments (http://pygments.org/). Dat kent meer dan 300 programmeertalen.
Het accepteert o.a. utf-8 als input.
Het kan niet rechtstreeks PDF genereren maar dat kun je via LaTeX krijgen.
--
Piet van Oostrum
Hallo Piet,
Bedankt, ik heb pygments geprobeerd. Een interessante optie maar ik ben niet echt onder de indruk van het resultaat met LaTeX. Eigenlijk net als met het listings pakket, het wordt gewoon niet echt mooij met LaTeX.
Ik heb voorlopig maar even voor de weg van de minste weerstand gekozen, ik heb een Python scriptje gemaakt dat alle regels met CJK karakters wegfiltert, en vervolgens gebruik ik a2ps op de gefilterde file. Kleurgebruik, syntax highlighting en layout van a2ps zijn superieur (nou, vind ik dan). Jammer, dan maar geen Japans commentaar in de PDF, maar CJK commentaar is wel gewoon in de source files beschikbaar.
Groeten,Wilfred
On Thursday, October 12, 2017 4:31 PM, Piet van Oostrum
Waarde allemaal,
Al jaren gebruik ik a2ps -> ps2pdf om source code (meestal FORTRAN, maak ook Python, Octave en soms LaTeX) om te zetten naar PDF. Dat werkt eigenlijk uitstekend - zolang je alleen "single byte encodings" gebruikt.
Ik ben bezig met wat programmeerwerk voor een student en het commentaar van de code schrijf ik in het Japans (Japanners en de Engelse taal...... dat blijft toch een heel aparte toestand). De files zijn gecodeerd in UTF-8. Met als gevolg dat a2ps zich verslikt; de "latijnse" karakters komen goed door maar de CJK karakters niet. Dat is een bekend fenomeen voor a2ps. Ik ben dus op zoek naar een vervanging voor a2ps maar dan wel een versie die UTF-8 aankan. Als jullie tips hebben hoor ik het graag.
Kijk eens naar Pygments (http://pygments.org/). Dat kent meer dan 300 programmeertalen.
Het accepteert o.a. utf-8 als input.
Het kan niet rechtstreeks PDF genereren maar dat kun je via LaTeX krijgen.
--
Piet van Oostrum
participants (2)
-
Piet van Oostrum
-
Wilfred van Rooijen