[opensuse-es] OT: Dividir un archivo XML gigante
Hola a todos, les expongo el siguiente caso: Necesito procesar un archivo XML muy grande, 1GB aproximado, el cual necesito transformarlo a otro formato, para lo cual uso un archivo XSLT y la transformacion se realiza con java, utilizando Saxon9 ( con xalan se cae al instante) el caso es que el saxon tambien esta llegando a su limite, pues se cae al momento de cargar el archivo xml, en algunas variables que usa, antes de realizar algun proceso de transformacion, asi que la unica alternativa es partir el archivo xml, en varios pequeños, y realizar muchos procesos, cuyos resultados debere unir en uno solo al final, entonces es donde me encuentro ahora, ¿Como partir el archivo XML gigante en varios archivos pequeños..? Saludos y gracias por sus comentarios JCarlos --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
2008/2/29, Juan Carlos Bravo Celis:
Necesito procesar un archivo XML muy grande, 1GB aproximado, el cual necesito transformarlo a otro formato, para lo cual uso un archivo XSLT y la transformacion se realiza con java, utilizando Saxon9 ( con xalan se cae al instante) el caso es que el saxon tambien esta llegando a su limite, pues se cae al momento de cargar el archivo xml, en algunas variables que usa, antes de realizar algun proceso de transformacion,
¿Has probado con "libxslt" y "php" para la transformación?
asi que la unica alternativa es partir el archivo xml, en varios pequeños, y realizar muchos procesos, cuyos resultados debere unir en uno solo al final, entonces es donde me encuentro ahora, ¿Como partir el archivo XML gigante en varios archivos pequeños..?
Hum... ¿es posible partir el xml sin que se pierda su estructura para que sea interpretado por el procesador xslt? :-? Otra opción, ajustar los parámetros del servidor web para darle más recursos. 1 GB. de archivo es mucho, quizá lo que cueste sea cargarlo y no hacer la transformación... prueba a hacerlo de forma local, asociando el xslt al xml directamente, a ver si lo puede transformar. Saludos, -- Camaleón --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
Juan Carlos Bravo Celis escribió:
Hola a todos, les expongo el siguiente caso: Necesito procesar un archivo XML muy grande, 1GB aproximado,
Intenta programar algo con la extension XMLREADER de PHP, nota que cualquier otra extension ( simplexml, DOM, etc) no te va a servir, porque todas esas abren el archivo entero en memoria. -- "Morality is merely an interpretation of certain phenomena — more precisely, a misinterpretation." - Friedrich Nietzsche Cristian Rodríguez R. Platform/OpenSUSE - Core Services SUSE LINUX Products GmbH Research & Development http://www.opensuse.org/ --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
El Viernes, 29 de Febrero de 2008, Juan Carlos Bravo Celis escribió:
Hola a todos, les expongo el siguiente caso: Necesito procesar un archivo XML muy grande, 1GB aproximado, el cual necesito transformarlo a otro formato, para lo cual uso un archivo XSLT y la transformacion se realiza con java, utilizando Saxon9 ( con xalan se cae al instante) el caso es que el saxon tambien esta llegando a su limite, pues se cae al momento de cargar el archivo xml, en algunas variables que usa, antes de realizar algun proceso de transformacion, asi que la unica alternativa es partir el archivo xml, en varios pequeños, y realizar muchos procesos, cuyos resultados debere unir en uno solo al final, entonces es donde me encuentro ahora, ¿Como partir el archivo XML gigante en varios archivos pequeños..?
* xml_split
jose maria escribió:
* xml_split
Cierto, para instalarlo zypper in --capability /usr/bin/xml_split -- "Morality is merely an interpretation of certain phenomena — more precisely, a misinterpretation." - Friedrich Nietzsche Cristian Rodríguez R. Platform/OpenSUSE - Core Services SUSE LINUX Products GmbH Research & Development http://www.opensuse.org/ --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
participants (4)
-
Camaleón
-
Cristian Rodríguez
-
jose maria
-
Juan Carlos Bravo Celis