cuelgue servidor error mm/memory.c:103: bad pmd
Hola a todos, He llegado hoy por la mañana y he visto que uno de los servidores estaba colgado y que en el fichero /var/log/messages habia esto: Jan 31 06:05:00 servidor /USR/SBIN/CRON[15123]: (root) CMD (/usr/bin/fetchmail >> /var/log/fetchmail) Jan 31 06:05:14 servidor kernel: mm/memory.c:103: bad pmd 0000010004000000(000000051e040003). Jan 31 06:05:14 servidor kernel: mm/memory.c:103: bad pmd 0000010004000008(0c00000000000000). Jan 31 06:05:14 servidor kernel: mm/memory.c:103: bad pmd 0000010004000010(00041f100000001f). ...... Es decir parece que despues de hacer el fetchmail la memoria ha empezado a fallar o algo asi. He reiniciado y ya vuelve a funcionar, pero me preocupa. Nunca habia visto algo asi. Alguien sabe de que puede ir esto? un saludo Emiliano Sutil
El 31/01/06, Emiliano Sutil<emiliano.sutil@gmail.com> escribió:
Hola a todos,
He llegado hoy por la mañana y he visto que uno de los servidores estaba colgado y que en el fichero /var/log/messages habia esto:
Jan 31 06:05:00 servidor /USR/SBIN/CRON[15123]: (root) CMD (/usr/bin/fetchmail >> /var/log/fetchmail) Jan 31 06:05:14 servidor kernel: mm/memory.c:103: bad pmd 0000010004000000(000000051e040003). Jan 31 06:05:14 servidor kernel: mm/memory.c:103: bad pmd 0000010004000008(0c00000000000000). Jan 31 06:05:14 servidor kernel: mm/memory.c:103: bad pmd 0000010004000010(00041f100000001f). ......
Es decir parece que despues de hacer el fetchmail la memoria ha empezado a fallar o algo asi.
He reiniciado y ya vuelve a funcionar, pero me preocupa. Nunca habia visto algo asi.
Alguien sabe de que puede ir esto?
a principio, yo revisaria la memoria.. memtest86+ bye -- -- Victor Hugo dos Santos Linux Counter #224399
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2006-01-31 a las 09:24 +0100, Emiliano Sutil escribió:
He llegado hoy por la mañana y he visto que uno de los servidores estaba colgado y que en el fichero /var/log/messages habia esto:
Jan 31 06:05:00 servidor /USR/SBIN/CRON[15123]: (root) CMD (/usr/bin/fetchmail >> /var/log/fetchmail) Jan 31 06:05:14 servidor kernel: mm/memory.c:103: bad pmd 0000010004000000(000000051e040003). Jan 31 06:05:14 servidor kernel: mm/memory.c:103: bad pmd 0000010004000008(0c00000000000000). Jan 31 06:05:14 servidor kernel: mm/memory.c:103: bad pmd 0000010004000010(00041f100000001f). ......
Es decir parece que despues de hacer el fetchmail la memoria ha empezado a fallar o algo asi.
No tengo claro que es eso. He estado mirando en "/usr/src/linux-2.6.11.4-21.8/mm/memory.c", y es código original de Linus del año 91, con algunas modificaciones posteriores de otros (una del 2004): /* * demand-loading started 01.12.91 - seems it is high on the list of * things wanted, and it should be easy to implement. - Linus */ Está relacionado con la memoria virtual: /* * Real VM (paging to/from disk) started 18.12.91. Much more work and * thought has to go into this. Oh, well.. * 19.12.91 - works, somewhat. Sometimes I get faults, don't know why. * Found it. Everything seems to work now. * 20.12.91 - Ok, making the swap-device changeable like the root. */ Lo que no encuentro son referencias a "bad pmd", aunque si muchas a "pmd" y algunas a "pmd_bad". Aunque veo multiples referencias a "PMD", no localizo que son esas siglas. Está relacionado con "pte" y "pgd". Debe ser algo muy básico... para los desarrolladores de kernels, claro. Parece estar relacionado con la memoria virtual. Podría ser un fallo al restaurar memoria swapeada.. cualquier cosa, no necesariamente un fallo de la memoria física. El mensaje en si parece imprimirlo "traps.c" - y digo parece, porque el codigo se repite para varios tipos de procesadores: void __pmd_error(const char *file, int line, unsigned long val) { printk("%s:%d: bad pmd %08lx.\n", file, line, val); } - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFD31JstTMYHG2NR9URAl6wAJ4goHKFkWZZAkQZcPBGzH5pQpT7IQCgiYSc GQbMrAstQ27jOW2WhuPQxL8= =xUC4 -----END PGP SIGNATURE-----
Hola Carlos, de todo lo que me has dicho me quedo con esto: :-)
Debe ser algo muy básico... para los desarrolladores de kernels, claro.
El resto me queda muy grande.... Ya os contaré si al revisar la memoria si me da algun error, o si se repite el error o si al final se va al carajo el server Un saludo Emi
Hola :) Emiliano Sutil wrote:
Hola Carlos, de todo lo que me has dicho me quedo con esto: :-)
Debe ser algo muy básico... para los desarrolladores de kernels, claro.
El resto me queda muy grande....
Ya os contaré si al revisar la memoria si me da algun error, o si se repite el error o si al final se va al carajo el server
Otra solución es compialr varias veces el kernel. Hace un uso muy grande de la memoria por lo que te ayuda a detectar problemas. Si la memoria está defectuosa puede ocurrir que: - unas veces compile y otras no - el tamaño del kernel nuevo varíe ... HTH Rafa -- Rafa Grimán Systems Engineer Silicon Graphics Spain Santa Engracia , 120 - Planta Baja 28003 Madrid, Spain Tel: +34 91 3984200 Fax: +34 91 3984201 Móvil: +34 628 117 940 http://www.sgi.com
participants (4)
-
Carlos E. R.
-
Emiliano Sutil
-
Rafa Grimán
-
Victor Hugo dos Santos