cancel
Showing results for 
Search instead for 
Did you mean: 

Rendimiento Alfresco 3.4.2

cybermakoki
Champ in-the-making
Champ in-the-making
Buenos dias,

Acabamos de migrar de la versión 3.1.1 a la 3.4.2 y el consumo de CPU no baja del 100%…

Nos hemos dado cuenta de que estos dos threads están consumiendo cada uno un 50%

DefaultScheduler_Worker-5
DefaultScheduler_Worker-7


Alguien podria decirme que son o que hacen estos threads??

Gracias y un saludo!
7 REPLIES 7

rmacian
Champ in-the-making
Champ in-the-making
La actualización habrá ido unida a una reindexación.

Es tipico que durante un periodo de tiempo la CPU se ponga al 100% ya que para reindexar el contenido se usan varios componentes (soffice y pdfbox) que consumen bastante CPU.

El tiempo es proporcional al volumen de datos. La solución es simplemente dejarlo terminar.

cybermakoki
Champ in-the-making
Champ in-the-making
Pues llevamos asi desde el Jueves pasado… a ver cuanto dura… lo curioso es que aunque la cpu esté al 100%, los usuarios trabajan bien…

rmacian
Champ in-the-making
Champ in-the-making
Que volumen de datos teneis? En un top que procesos salen con la cpu a tope ? Usais CIFS ?

Si pones la salida del log quizás podemos ver algo más…

cybermakoki
Champ in-the-making
Champ in-the-making
El proceso que se está comiendo la cpu es el java.exe, y con el jconsole vemos que los dos hilos que se están comiendo la CPU son los indicados en el primer post…

No tenemos CIFS activado, los ficheros entran por FTP y correo electrónico, y ahora mismo hay medio millón de documentos.

rmacian
Champ in-the-making
Champ in-the-making
En el log se ve algo ? si hay una indexación en marcha se ve facilmente porque de vez en cuando salen mensajes de pdfbox. Monitorizando el tamaño del directorio lucene-indexes también nos podemos hacer una idea.

El indexado de 500k documentos puede llevar bastante tiempo y puede durar varios días, pero lo importante es ver que efectivamente esta indexando y no se trata de otro problema

cybermakoki
Champ in-the-making
Champ in-the-making
En el log he visto esto… sin hacer nada, de repente salen estas trazas

INFO: Server startup in 220744 ms[5A, 00, 00, 00, 6D, 00, 61, 00, 69, 00, 6C, 00, 74, 00, 6F, 00, 3A, 00, 42, 00, 41, 00, 53, 00, 4B, 00, 45, 00, 52, 00, 56, 00, 49, 00, 4C, 00, 4C, 00, 45, 00, 53, 00, 4C, 00, 40, 00, 48, 00, 4F, 00, 54, 00, 4D, 00, 41, 00, 49, 00, 4C, 00, 2E, 00, 43, 00, 4F, 00, 4D, 00, 00, 00, 79, 58, 81, F4, 3B, 1D, 7F, 48, AF, 2C, 82, 5D, C4, 85, 27, 63, 00, 00, 00, 00, A5, AB, 00, 00][5A, 00, 00, 00, 6D, 00, 61, 00, 69, 00, 6C, 00, 74, 00, 6F, 00, 3A, 00, 42, 00, 41, 00, 53, 00, 4B, 00, 45, 00, 52, 00, 56, 00, 49, 00, 4C, 00, 4C, 00, 45, 00, 53, 00, 4C, 00, 40, 00, 48, 00, 4F, 00, 54, 00, 4D, 00, 41, 00, 49, 00, 4C, 00, 2E, 00, 43, 00, 4F, 00, 4D, 00, 00, 00, 79, 58, 81, F4, 3B, 1D, 7F, 48, AF, 2C, 82, 5D, C4, 85, 27, 63, 00, 00, 00, 00, A5, AB, 00, 00]09:48:19,821  WARN  [pdfbox.pdfparser.PDFParser] Parsing Error, Skipping Objectjava.io.IOException: Error: Expected an integer type, actual='R0000'        at org.apache.pdfbox.pdfparser.BaseParser.readInt(BaseParser.java:1380)        at org.apache.pdfbox.pdfparser.PDFParser.parseObject(PDFParser.java:499)        at org.apache.pdfbox.pdfparser.PDFParser.parse(PDFParser.java:172)        at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:878)        at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:843)        at org.apache.tika.parser.pdf.PDFParser.parse(PDFParser.java:74)        at org.alfresco.repo.content.transform.TikaPoweredContentTransformer.transformInternal(TikaPoweredContentTransformer.java:185)        at org.alfresco.repo.content.transform.AbstractContentTransformer2.transform(AbstractContentTransformer2.java:161)        at org.alfresco.repo.content.transform.AbstractContentTransformer2.transform(AbstractContentTransformer2.java:137)        at org.alfresco.repo.search.impl.lucene.ADMLuceneIndexerImpl.indexProperty(ADMLuceneIndexerImpl.java:949)        at org.alfresco.repo.search.impl.lucene.ADMLuceneIndexerImpl.createDocumentsImpl(ADMLuceneIndexerImpl.java:621)        at org.alfresco.repo.search.impl.lucene.ADMLuceneIndexerImpl.createDocuments(ADMLuceneIndexerImpl.java:586)        at org.alfresco.repo.search.impl.lucene.ADMLuceneIndexerImpl.updateFullTextSearch(ADMLuceneIndexerImpl.java:1590)        at org.alfresco.repo.search.impl.lucene.fts.FullTextSearchIndexerImpl.index(FullTextSearchIndexerImpl.java:217)        at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)        at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)        at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)        at java.lang.reflect.Method.invoke(Method.java:597)        at org.springframework.aop.support.AopUtils.invokeJoinpointUsingReflection(AopUtils.java:307)        at org.springframework.aop.framework.ReflectiveMethodInvocation.invokeJoinpoint(ReflectiveMethodInvocation.java:183)        at org.springframework.aop.framework.ReflectiveMethodInvocation.proceed(ReflectiveMethodInvocation.java:150)        at org.springframework.transaction.interceptor.TransactionInterceptor.invoke(TransactionInterceptor.java:107)        at org.springframework.aop.framework.ReflectiveMethodInvocation.proceed(ReflectiveMethodInvocation.java:172)        at org.springframework.aop.framework.JdkDynamicAopProxy.invoke(JdkDynamicAopProxy.java:202)        at $Proxy78.index(Unknown Source)        at org.alfresco.repo.search.impl.lucene.fts.FTSIndexerJob.execute(FTSIndexerJob.java:46)        at org.quartz.core.JobRunShell.run(JobRunShell.java:216)        at org.quartz.simpl.SimpleThreadPool$WorkerThread.run(SimpleThreadPool.java:549)‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

y se pone la cpu al 100%

rmacian
Champ in-the-making
Champ in-the-making
Eso es que esta reindexando, suelen salir algunos warnings de vez en cuando porque no todos los pdfs se han generado igual y la libreria que los trata alguna vez es incapaz de leer el contenido completo

A veces actualizar el pdfbox puede solucionar problemas

http://issues.alfresco.com/jira/browse/ALF-8097

http://archive.apache.org/dist/pdfbox/