Fedora Commons Code

Brought to you by: aawoods, ajs6f, arrang, barmintor, and 13 others

Commit [r8650] Maximize Restore History

pdfbox-1.1.0.jar instead of PDFBox-0.7.2.jar

When exceptions are thrown during text extraction, they will be caught and empty index field returned with a log warning.
Before, exceptions were sent back to the indexing stylesheet, which would cancel the indexing,
now the index document will just lack the full text index field.
Text extraction from PDF documents now puts spaces instead of characters 00-31, because they have caused exception during indexing.

Authored by: gertsp 2010-06-17

Browse code at this revision

Parent: [r8649]

Child: [r8651]

removed	/services/genericsearch/trunk/FedoraGenericSearch/lib/PDFBox-0.7.2.jar
added	/services/genericsearch/trunk/FedoraGenericSearch/lib/pdfbox-1.1.0.jar
changed	/services/genericsearch/trunk/FedoraGenericSearch/src/java/dk/defxws/fedoragsearch/server/GenericOperationsImpl.java
changed	/services/genericsearch/trunk/FedoraGenericSearch/src/java/dk/defxws/fedoragsearch/server/TransformerToText.java

/services/genericsearch/trunk/FedoraGenericSearch/lib/PDFBox-0.7.2.jar

File was removed.

/services/genericsearch/trunk/FedoraGenericSearch/lib/pdfbox-1.1.0.jar

Binary file was added.

Fedora Commons Code

Commit [r8650] Maximize Restore History

/services/genericsearch/trunk/FedoraGenericSearch/lib/PDFBox-0.7.2.jar

/services/genericsearch/trunk/FedoraGenericSearch/lib/pdfbox-1.1.0.jar

/services/genericsearch/trunk/FedoraGenericSearch/src/java/dk/defxws/fedoragsearch/server/GenericOperationsImpl.java Diff Switch to side-by-side view

/services/genericsearch/trunk/FedoraGenericSearch/src/java/dk/defxws/fedoragsearch/server/TransformerToText.java Diff Switch to side-by-side view