Hola,
Si el documento ya pasó por un proceso previo de OCR, Alfresco lo indexará apropiadamente, pues es un documento PDF-Searchable.
En caso contrario, lo usual es primero llevar a cabo un reconocimiento óptico de carácteres sobre el documento original, mediante una transformación en Alfresco. Para ello puedes usar tesseract, cuneiform y otras herramientas disponibles.
Saludos.