Anwendungs-Software und Apps 14.141 Themen, 69.585 Beiträge

epub E-Books: Silbentrennungszeichen entfernen

Oliver1967 / 14 Antworten / Baumansicht Nickles

 

Tach auch!

Ich sammle Bücher in Form von .pdf, .epub, .mobi oder .wasauchimmer.

Jetzt habe ich hier eine schöne Edition sämtlicher Werke von Arkadi & Boris Strugatzki in acht Bänden. Einziger Schönheitsfehler: In einem der Bände werden die Trennungszeichen zwischen den Silben mitangezeigt, und ich krieg die Dinger nicht weg.

Mit Sigil habe ich probeweise mal versucht, das Problem zu beseitigen indem ich die Schriftart wechsle, aber eine solche Option scheint dieses ach so tolle e-book-Bearbeitungsprogramm nicht zu bieten...

Hat jemand eine Idee, wie ich diese Zeichen (z.B. mit Calibre) entfernen kann?

Vielen Dank schon mal.

 

bei Antwort benachrichtigen
ObelixSB Oliver1967

„epub E-Books: Silbentrennungszeichen entfernen“

Optionen

Hi,

dass Sigil da keine Option bietet, find ich schob ok, da es nicht üblich ist, dass Silbentrennung im Buch gecodet ist. Normalerweise ist Silbentrennung Sache des Readers. 

Welches Zeichen wird denn angezeigt ? Soft-Hyphens (shy) oder nur ein Strich ? 

Kannst die Zeichen nicht in Sigil mit Suchen und Ersetzen löschen ?

bei Antwort benachrichtigen
Oliver1967 ObelixSB

„Hi, dass Sigil da keine Option bietet, find ich schob ok, da ...“

Optionen

 

Hi Obelix,

wenn ich das Buch in Sigil öffne, werden die Trennungszeichen (kleine Quadrate) gar nicht angezeigt. Aber da Sigil ein Editor und kein Reader ist, nützt mir das wenig. Wer will seine Bücher schon jedesmal in einem Editor-Programm lesen...

Standard-Reader ist bei mir der "Viewer for all e-book formats" von calibre. Dort gibt es keine suchen/entfernen-Option. Und wenn ich calibre im Editor-Modus nutze, werden die Quadrate wieder nicht angezeigt! Aaargh!

Letztlich könnte ich das Buch natürlich durch hin- und herkonvertieren (epub>rtf>epub) bereinigen, aber dann versaue ich das einheitliche Design der acht Bände.

Mann, es muß doch irgendwo eine Option zum Entfernen dieser Zeichen geben!

 

 

bei Antwort benachrichtigen
ObelixSB Oliver1967

„Hi Obelix, wenn ich das Buch in Sigil öffne, werden die ...“

Optionen

Sehr merkwürdig, dass es sich um ein kleines Quadrat handelt, es kann sich da nicht um ein echtes Trennungszeichen (shy) handeln, da der Calibre Viewer keine Silbentrennung anzeigt und Soft-Hyphens einfach ignoriert.

Ich benutze für meinen Kindle, der von der Reader-Sotware auch keine Silbentrennung kann, das Calibre Plug-In  "Hyphenate This", mit dem Soft-Hyphens in ein Buch gebracht werden. Diese werden in Sigil auch nicht angezeigt, machen aber auch im Calibre-Viewer keine Probleme. Mit dem Plug-In kann man die Silbentrennung auch wieder entfernen, was mal einen Versuch wert wäre, ich befürchte aber eher, dass die kleinen Quadrate damit auch nicht entfernt werden.

Ich denke eher, dass hier ein falsches Zeichen durch eine fehlerhafte Umwandlung einer pdf-Datei in epub  ins Buch kam.

Woher hast denn das Buch ? Wen es ein freies Buch ist, kannst ja mal den Link posten, dann kann ich mir es mal genau anschauen.

Ich würde trotzdem mal hin und her konvertieren, um zu sehen, ob die falschen Zeichen dabei verschwinden, arbeitest dabei eben mit einer Kopie des Buches, damit das Original noch bleibt.

bei Antwort benachrichtigen
Oliver1967 ObelixSB

„Sehr merkwürdig, dass es sich um ein kleines Quadrat ...“

Optionen

Ich habe Hyphenate this! jetzt runtergeladen und ausprobiert (Version 0.0.7), aber das Teil verlangt, daß ich erstmal die Dictionaries runterlade, bevor es irgendwas macht.

Das Buch habe ich aus einem kostenpflichtigen E-Book-Forum, das ich hier wahrscheinlich nicht nennen darf, aber ich hab es zur Ansicht selber mal hochgeladen:

http://limelinx.com/mgv2

Ansonsten habe ich jetzt vorläufig folgende Lösung gefunden: In den calibre-Einstellungen (Optionen>Allgemein>Sonstige Optionen) habe ich den Haken bei "Trennen (Silbentrennung bei langen Worten)" rausgenommen.

Jetzt werden die Zeichen auch in der Viewer-Ansicht nicht mehr angezeigt. Allerdings gilt das jetzt für alle E-Books: Es wird keine Silbentrennung mehr vorgenommen. Ich habe einige Dateien probeweise geöffnet und muß sagen, daß es eigentlich keinen Unterschied macht.

Bis ich eine "richtige" Lösung finde, kann ich damit leben.

 

bei Antwort benachrichtigen
ObelixSB Oliver1967

„Ich habe Hyphenate this! jetzt runtergeladen und ausprobiert ...“

Optionen

So, habs mir angesehn, am besten den Link wieder löschen.

Hab das Buch mit dem Calibre Viewer als auch mit Adobe Digital Editions angesehen, beidesmal korrekte Ansicht, die kleinen Quadrate sehe ich nicht.

Allerdings sind in das Buch Schriften und Schriftfonts mit eingebettet, kann es sein, dass dein PC einen der Fonts nicht richitg anzeigen kann ?

Ich benutzte Windows 7, hast du eventuell Linux  ?

Versuch doch mal, die eingebetteten Schriften zu löschen.

Wenn du nur am PC liest, würde ich auch einen anderen Reader nehmen, der mehr Möglichkeiten bietet, Coolreader 3 zB.

bei Antwort benachrichtigen
groggyman ObelixSB

„So, habs mir angesehn, am besten den Link wieder löschen. ...“

Optionen

Hallo

Da mich das Thema nicht los gelassen hat, habe ich mir Calibre 1.14 auf den iMac geladen und das Demostück geladen. Die Darstellung weist keine Fehler in der Schrift auf, egal in welcher Breite ich das Fenster nutze. Daher sehe auch ich ein Problem in der fehlenden Schriftart.

-groggyman-

bei Antwort benachrichtigen
Onkel_Alois groggyman

„Hallo Da mich das Thema nicht los gelassen hat, habe ich mir ...“

Optionen

Auch ich habs eben mit Adobe Digital Editions gelesen - der beschriebene Fehler ist nicht zu sehen.

Scheint wohl doch am Reader vom Oliver zu liegen.

 

Gruß Alois

 

 

Mir scheint, als sei der IQ mancher User umgekehrt proportional zur Versionsnummer des verwendeten Betriebssystemes
bei Antwort benachrichtigen
Oliver1967 ObelixSB

„So, habs mir angesehn, am besten den Link wieder löschen. ...“

Optionen

Ist ja echt merkwürdig, das Ganze.

Jedenfalls habe ich jetzt die eingebetteten Schriftarten gelöscht, und - ta-daa - jetzt stimmt alles. Und die Datei ist plötzlich nur noch 640 KB groß, statt wie vorher 1,75 MB.

Daß es an den Schriftarten lag versteh ich zwar nicht, denn es wurde ja zuviel angezeigt und nicht zuwenig, aber egal, das Problem ist gelöst. Es muß also an calibre gelegen haben (ich nutze übrigens Windows 7 SP1 ultimate x64).

Einem neuen Reader gegenüber wäre ich aufgeschlossen, denn calibre nutze ich nicht aus Überzeugung sondern mangels Alternativen. Den CoolReader hab ich. Da vermisse ich aber irgendwie den Buch-Look mit seitenweise aufgeteiltem Text. Für weitere Vorschläge wäre ich aufgeschlossen.

Da fällt mir jetzt noch eine Kleinigkeit ein, die ganz gut hierher passt. Vielleicht kann das jemand beantworten, ohne daß ich einen neuen Thread anfangen muß:

In fast allen .epub-Dateien wird vor Auslassungszeichen ("...") ein Leerzeichen eingefügt, das dort nicht hingehört. Wenn ich Bücher nach .rtf konvertiere (was ich oft tue, um ein anständiges Layout hinzukriegen und den Text nach .pdf zu konvertieren) muß ich dieses Leerzeichen manuell entfernen, was eine Sauarbeit ist. Suchen/Ersetzen von "[Leerzeichen]..." nach "..." funktioniert nicht.

Von den technischen Details der E-Books habe ich wenig Ahnung, wie Ihr wohl gemerkt habt. Hat da jemand einen Tipp?

Für Eure Hilfe bis hierhin jedenfalls schon mal vielen Dank.

 

 

bei Antwort benachrichtigen
ObelixSB Oliver1967

„Ist ja echt merkwürdig, das Ganze. Jedenfalls habe ich ...“

Optionen

Hi,

freut mich ja dass es geklappt hat, was da bei dir mit den Schriften nicht funktioniert hat weiß ich auch nicht, aber Hauptsache, es geht jetzt. Das die Datei danach wesentlich kleiner ist, ist ganz klar: in EBooks nehmen Schriten und Bilder den meisten Speicherplatz ein, der Text braucht recht wenig.

 

Zu den Auslassungszeichen: das Leerzeichen ist da, weils der Autor/EBookersteller so geschrieben hat, automatisch ist das nicht.  Teils ist da ein Leerzeichen auch richtig. Habs extra nochmal nachgelesen: Wird ein Wortteil ersetzt kommt kein Leerzeichen, wird aber ein Teil des Satzes ersetzt kommt ein Leerzeichen davor. Meist werden ja auch nur einfach 3 Punkte benutzt, es gibt aber auch ein eigenes Zeichen: … (alt+0133).

Zum Nachlesen Typefacts

 

Zum technischen Aufbau von EBooks in epub:

epub ist vereinfacht gesagt eine zip-Datei, in der (x)html-Dateien und Dateien mit Inhaltsverzeichnis enthalten sind. Die xhtml-Dateien werden dabei recht ähnlich wie eine Webseite aufgebaut: html für die Struktur, css für das Aussehen. Wenn dich da einarbeiten willst, einfach nach Anleitungen für html und css googlen, ich persönlich fand selfhtml immer ganz gut, ist zwar nicht mehr aktuell, aber auf einem für epub ausreichenden Stand. Da du ja Sigil schon hast, schau dir da mal den Aufbau von epubs an, spiel dann mal mit css rum, ist alles kein Hexenwerk,

 

Als Reader: wie wärs denn mit einem EBook-Reader mit E-Ink ? Der kleine Kindle zB kostet nur noch 49 Euro und das Lesen ist wesentlcih angenehmer als am PC.

 

PS: die Leerzeichen müssten sich mit Suchen/Ersetzen löschen lassen, wenn man RegEx (Reguläre Ausdrücke)  verwendet, damit würden aber alle gelöscht, auch die die hingehören. Bei RegEx bin ich aber auch noch Anfänger, deswegen kann ich da keinen Ausdruck erstellen.

 

bei Antwort benachrichtigen
Borlander ObelixSB

„Hi, freut mich ja dass es geklappt hat, was da bei dir mit ...“

Optionen
wie wärs denn mit einem EBook-Reader mit E-Ink ? Der kleine Kindle zB kostet nur noch 49 Euro und das Lesen ist wesentlcih angenehmer als am PC.

E-Ink würde ich auch empfehlen. Beim Kindle sollte man allerdings berücksichtigen, dass der kein ePub unterstütz und die Darstellung durch Konvertierung nicht besser wird.

Gruß
Borlander

bei Antwort benachrichtigen
ObelixSB Borlander

„E-Ink würde ich auch empfehlen. Beim Kindle sollte man ...“

Optionen

Die Konvertierung von epub zu mobi bzw. azw3(KF8) ist mit Calibre völlig unproblematisch und die Darstellung identisch mit epub, schließlich werden ja die meisten Bücher für Amazons Kindle-Format aus epub erstellt, das alte mobi-Format war hier schlechter, KF8 ist bei den Tags für E-Ink-Books zu 99% identisch mit epub, nur eben anders verpackt.

bei Antwort benachrichtigen
Borlander ObelixSB

„Die Konvertierung von epub zu mobi bzw. azw3 KF8 ist mit ...“

Optionen
Die Konvertierung von epub zu mobi bzw. azw3(KF8) ist mit Calibre völlig unproblematisch und die Darstellung identisch mit epub

Hm. Ich hatte da bislang eher durchwachsene Erfahrungen gemacht. Mag aber auch an den Vorlagen gelegen haben. Oder neue Versionen von Calibre machen das besser.

bei Antwort benachrichtigen
Borlander Oliver1967

„Ist ja echt merkwürdig, das Ganze. Jedenfalls habe ich ...“

Optionen
Daß es an den Schriftarten lag versteh ich zwar nicht, denn es wurde ja zuviel angezeigt und nicht zuwenig

U.U. war in der bisherigen Schritart kein Umbruchzeichen enthalten. Teilweise erfolgt dann eine Ersatzdarstellung. Ich kenne das ansonsten aber vor allem von fehlenden Unicode-Zeichen, die dann (zumindst unter Linux) als Rechteck mit dem Zeichencode drin dargestellt werden.

In fast allen .epub-Dateien wird vor Auslassungszeichen ("...") ein Leerzeichen eingefügt, das dort nicht hingehört.

Hast Du das ganze denn überhaupt schon mal auf einem eBook angeschaut?

Gruß
Borlander

bei Antwort benachrichtigen
Oliver1967 Borlander

„U.U. war in der bisherigen Schritart kein Umbruchzeichen ...“

Optionen

Nein, hab ich nicht. Da hab ich weiter oben auch ein Mißverständnis ausgelöst. Mit "Reader" meinte ich ein E-Book-Readerprogramm für den PC und kein separates Gerät.

Ich habe hier auf meiner Wohnzimmercouch mein Cockpit eingerichtet, mit großem LCD an der Wand (wahlweise als TV oder PC-Monitor zu nutzen) und einen 22"-Zoll-Monitor links neben mir, so daß ich alles an Multimedia ansehen kann, ohne meinen Allerwertesten anheben zu müssen. Wenn ich in der U-Bahn durch die Stadt fahre, lese ich Zeitungen/Zeitschriften, so daß ich gar keinen Reader (Gerät) brauche.

@ObelixSB: Interessante Lektüre. Von verschiedenen Arten Auslassungspunkten wußte ich nichts. Und ich dachte, ich beherrsche meine Muttersprache ...

Vielen Dank Euch beiden für die Hilfe.

Gute Nacht,

Oliver

 

bei Antwort benachrichtigen