paper

13
Clustering Gravitacional Adaptativo Arias Chipana, Carlos Mauricio A. School of Computer Science San Pablo Catholic Univesity Arequipa, Perú [email protected] Patiño Escarcina, Raquel Esperanza School of Computer Science San Pablo Catholic Univesity Arequipa, Perú [email protected] Túpac Valdivia, Yvan Jesús School of Computer Science San Pablo Catholic Univesity Arequipa, Perú [email protected] Abstract—Currently the problem of grouping patterns has been investigated from many different contexts and for many different researchers of diferent areas of research. This reflects its usability in explorative data analysis, which is used in many computing applications. In both sides, its design and in the operators that generate them. Procedures of data analysis can be divided into explorers and exploiters algorithms. This based on the ability of models and source input data . However conbinatory problems exists when generating clusters and other problems that revolve around the context of the data to be analyzed. Natural computing is the foundation genesis of algorithms based on how nature acts to solve efficiently problems that are too complex. Many of which are used in artificial intelligence and clustering has been designed in this way. Among these are for example: neural networks [1], swarm algorithm as ant colony systems [2], bee colonies systems [3], genetic algorithms [4] , among others. So the objetive of this work is the proposing and implementation of a novel clustering method . Having the actual theory of planet formation from a primordial nebula that rotates around a star as inspiration. This is the protosolar nebula theory now called SNDM. Basically we use diferent data sets to probe it. Obtained results are good and there are plotted to help us to see the final clusters. Keywords-Clustering, Gravitational Forces, Artificial Intelli- gence, Data Mining, Data Visualization, Patterns, Solar Disk Nebula Model. I. I NTRODUCCIÓN Se conoce como clústering a la clasificación no supervisada de patrones, basados en la similaridad de éstos, denominados clústers. De esta manera un patrón puede ser definido como observaciones, puntos dimensionales en un espacio (sea euclideáno o vectorial), datos y/o vectores caraterísticos, etc. Intuitivamente podemos inferir que los patrones dentro de un clúster son más similares a los elementos que pertenezcan a otro. El clustering es también utlizado en muchos procesos de análisis exploratorio de datos, agrupamientos, toma de decisiónes, aprendizaje de máquina, minería de datos, extracción de información, etc. Para informacion detallada revisar [5] Es importante entender la diferencia entre clústering y clasificación. Clústering se define como una clasificación no supervisada de elementos donde el problema principal es encontrar agrupamientos útiles a partir de un conjunto de datos no relacionados. Clasificación, en otro punto de vista, se debe entender como un análisis supervisado de una colección de datos etiquetados pre-clasificados, donde el objetivo es etiquetar nuevos patrones encontrados basados en los ya clasificados. La computación natural, por otro lado, se basa en el afán del hombre para resolver situaciones con las que se ha encontrado a lo largo de la historia. Y que le han llevado a la búsqueda de métodos o algoritmos de resolución que le permitan resolver en tiempo y espacio todo tipo de problemas. Además se sabe que la naturaleza y los procesos que en ella se realizan han sido una fuente constante de inspiración para poder encontrar dichos algoritmos. Por ende es muy importante comprender dichos procesos, siendo la naturaleza misma el fundamento de la computación natural. Teniendo en consideración que la naturaleza resuelve los problemas considerando una búsqueda probabilística de resultados a partir del conjunto de soluciones potenciales, siendo en algunos casos de una manera eficiente, rápida y escalable, [6]. Un ejemplo bien conocido de la aplicación del conocimiento obtenido de la biología, son las ANN [7]. Entre otros algoritmos tenemos: - Algoritmos evolutivos: SA, GA. - Algoritmos de emjambre:ACS, BCO. - Computación por mebranas MC, etc. Una metáfora puede ser realizada de la siguiente forma. El universo puede verse como un gran clúster. En primera instancia los planetas son clústers de partículas. Las estrellas son clústers de planetas. Las galaxias son clústers de estrellas. Los conglomerados son clústers de galaxias. Los súper conglomerados son clústers de conglomerados de galaxias. Y finalmente los filamentos son clústers de súper conglomerados de galaxias. Viendo la magnitud del universo debemos destacar que nuestro trabajo solamente se centra en el proceso de creación de los sistemas solares, formación planetaria. Los estudios sobre el origen de la nebulosa protosolar (SNDM) datan del trabajo de Descártes en el año 1644. A pesar de la existencia de diferentes teorías, es el modelo más compatible con las obsevaciones realizadas por [8] en 1644 y [9] en 1796. El modelo laplaciano propone que el Sol y sus planetas

Upload: carlos-mauricio-a-ch

Post on 09-Nov-2015

3 views

Category:

Documents


0 download

DESCRIPTION

no se

TRANSCRIPT

  • Clustering Gravitacional AdaptativoArias Chipana, Carlos Mauricio A.

    School of Computer ScienceSan Pablo Catholic Univesity

    Arequipa, [email protected]

    Patio Escarcina, Raquel EsperanzaSchool of Computer ScienceSan Pablo Catholic Univesity

    Arequipa, [email protected]

    Tpac Valdivia, Yvan JessSchool of Computer ScienceSan Pablo Catholic Univesity

    Arequipa, [email protected]

    AbstractCurrently the problem of grouping patterns hasbeen investigated from many different contexts and for manydifferent researchers of diferent areas of research. This reflectsits usability in explorative data analysis, which is used in manycomputing applications. In both sides, its design and in theoperators that generate them. Procedures of data analysis canbe divided into explorers and exploiters algorithms. This basedon the ability of models and source input data . Howeverconbinatory problems exists when generating clusters and otherproblems that revolve around the context of the data to beanalyzed.

    Natural computing is the foundation genesis of algorithmsbased on how nature acts to solve efficiently problems that aretoo complex. Many of which are used in artificial intelligenceand clustering has been designed in this way. Among theseare for example: neural networks [1], swarm algorithm as antcolony systems [2], bee colonies systems [3], genetic algorithms[4] , among others.

    So the objetive of this work is the proposing and implementationof a novel clustering method . Having the actual theory ofplanet formation from a primordial nebula that rotates arounda star as inspiration. This is the protosolar nebula theory nowcalled SNDM. Basically we use diferent data sets to probe it.Obtained results are good and there are plotted to help us tosee the final clusters.

    Keywords-Clustering, Gravitational Forces, Artificial Intelli-gence, Data Mining, Data Visualization, Patterns, Solar DiskNebula Model.

    I. INTRODUCCIN

    Se conoce como clstering a la clasificacin no supervisadade patrones, basados en la similaridad de stos, denominadosclsters. De esta manera un patrn puede ser definido comoobservaciones, puntos dimensionales en un espacio (seaeuclideno o vectorial), datos y/o vectores caratersticos, etc.Intuitivamente podemos inferir que los patrones dentro de unclster son ms similares a los elementos que pertenezcan aotro. El clustering es tambin utlizado en muchos procesosde anlisis exploratorio de datos, agrupamientos, tomade decisines, aprendizaje de mquina, minera de datos,extraccin de informacin, etc. Para informacion detalladarevisar [5]

    Es importante entender la diferencia entre clstering yclasificacin. Clstering se define como una clasificacin

    no supervisada de elementos donde el problema principales encontrar agrupamientos tiles a partir de un conjuntode datos no relacionados. Clasificacin, en otro punto devista, se debe entender como un anlisis supervisado deuna coleccin de datos etiquetados pre-clasificados, donde elobjetivo es etiquetar nuevos patrones encontrados basados enlos ya clasificados.

    La computacin natural, por otro lado, se basa en elafn del hombre para resolver situaciones con las que se haencontrado a lo largo de la historia. Y que le han llevadoa la bsqueda de mtodos o algoritmos de resolucin quele permitan resolver en tiempo y espacio todo tipo deproblemas. Adems se sabe que la naturaleza y los procesosque en ella se realizan han sido una fuente constante deinspiracin para poder encontrar dichos algoritmos. Por endees muy importante comprender dichos procesos, siendo lanaturaleza misma el fundamento de la computacin natural.Teniendo en consideracin que la naturaleza resuelve losproblemas considerando una bsqueda probabilstica deresultados a partir del conjunto de soluciones potenciales,siendo en algunos casos de una manera eficiente, rpida yescalable, [6]. Un ejemplo bien conocido de la aplicacin delconocimiento obtenido de la biologa, son las ANN [7]. Entreotros algoritmos tenemos: - Algoritmos evolutivos: SA, GA.- Algoritmos de emjambre:ACS, BCO. - Computacin pormebranas MC, etc.

    Una metfora puede ser realizada de la siguiente forma.El universo puede verse como un gran clster. En primerainstancia los planetas son clsters de partculas. Las estrellasson clsters de planetas. Las galaxias son clsters de estrellas.Los conglomerados son clsters de galaxias. Los sperconglomerados son clsters de conglomerados de galaxias. Yfinalmente los filamentos son clsters de sper conglomeradosde galaxias. Viendo la magnitud del universo debemosdestacar que nuestro trabajo solamente se centra en el procesode creacin de los sistemas solares, formacin planetaria. Losestudios sobre el origen de la nebulosa protosolar (SNDM)datan del trabajo de Descrtes en el ao 1644. A pesar de laexistencia de diferentes teoras, es el modelo ms compatiblecon las obsevaciones realizadas por [8] en 1644 y [9] en 1796.

    El modelo laplaciano propone que el Sol y sus planetas

  • fueron formados debdo a la rotacin de una nebulosa degas incandescente aplanada hace unos 4.6 billiones de aos.Dicha estrella fue formada al centro de la nebulosa y losplanetas, que en un inicio fueron denominados planetesimales,[10], [9], [11], que orbtan en torno al cuerpo central demasa dominante el cual acelera su velocidad de rotacinconforme va decreciendo su temperatura. Estos planetsimosal cruzarse en sus rbitas entonces colisinan, debido a lafuerza gravitacional ejercida entre ambos, originando uncuerpo de mayor masa. Este mecansmo operado a lo largodel tiempo origina cuerpos de mayor tamao hasta queeventualmente alcanzan las dimensiones de un planeta, [12],[13].

    Actualmente, con el incremento en la cantidad de informacinobtenida tanto en las industrias como en la bsqueda denuevo conocimiento cientfico. Existe la necesidad degenerar clsters de una cantidad muy grande de patrones,clstering masivo. Si bien las tcnicas de clusterizacinpermiten encontrar agrupamientos de patrones que presentansimilitudes entre s, los cuales sern utilizados posteriomentepara poder ubicar nuevos elementos existentes en susconjuntos respectivos. Existe una brecha entre la eficacia yeficiencia de los mismos, puesto que ambas son inversamenteproporcionales. Se requiere por tanto algoritmos capaces detener un balance entre ambas variables

    Motivados en la naturaleza del universo y su funcionamiento.Nos centraremos el proceso de formacin planetaria de lacual podemos, a grandes razgos, crear una analoga entre unplaneta, clster, que esta conformado por partculas de polvo,patrones. El objetivo principal de este trabajo, es el desarrollarun nuevo algoritmo de clusterizacin masiva. Proponiendo unesquema basado en la teora de formacin planetaria, SNDM.Que permita un balance entre la eficacia y la eficiencia enel resultado de los clusters. En la seccin segunda, se daruna breve descripcin sobre el estado del arte actual referenteal rea a abordar. En el tercero se describir a detalle lateora de la nebulosa protosolar (SNDM). Seguidamente enla seccin cuarta se presentar una descripcin formal delalgoritmo. En la quinta se mostrarn los resultados obtenidosmientras que en las secciones sexta y sptima se podr verlas conclusiones y trabajos futuros as como las posiblesextensiones al algoritmo en otros contextos, finalmente en laseccin final.

    II. TRABAJOS RELACIONADOS

    La ley de gravitacin universal ha sido utilizada yaampliamente desde 1977, ao en el cual Wright [14] di aconocer un nuevo algoritmo de clusterizacin basado usandola gravedad como mtrica de agrupamiento. El trabajo de [14]propone un algoritmo aglomerativo y jerrquico para realizaragrupamientos en espacios eucldeos. El algoritmo proponeque cada partcula es incialmente un clster. Aplicando lasleyes fsicas de gravitacin universal y la dinmica de cuerpos.

    Modela un sistema dnamico para generar clusterizacin.

    El algoritmo propone que dada una partcula i esta esinfluenciada por todas las partculas en el sistema. Siendoesta la razn por la cual su tiempo de ejecucin es de O(N2).Sin embargo asegura una interaccin completa modelandode mejor manera el fenmeno. Una vez que una partcula esacreta, esta sale del sistema y la nueva posicin de cualquierotra se calcula usando las partculas restantes. Cuando dospartculas estan muy cerca una de la otra son mezcladas,siendo una de ellas removida de la simulacin y la masa dela otra es incrementada con la masa de la partcula removida.Existe una mxima distancia que cada partcula puedemoverse en cada interacin, siendo este parmetro fijo por elusuario. La simulacin termina cuando solo queda una solapartcula en el sistema. Finalmente se debe considerar ademsque dicha propuesta no utiliza una constante gravitacional.

    Una propuesta ms avanzada es realizada por Gomez[15] propone una nueva simulacin dinmica. las principalesventajas respecto a la propuesta establecida por Wright[14], son la velocidad, robustez y el no determinismo (nosupervisadas). La propuesta de Gomez [15] indica que unapartcula sera influenciada solo por otra mas no por todoel sistema. A su vez, los clusters son formados usando unaestuctura de uniones y bsqueda, por lo cual nunca se vereducido el nmero de patrones. Los valores necesarios paraasegurar un la validez de un clster son muy pequeos, todoellos variando entre E4, bajo los experimientos realizados,se puede determinar que dichos valores solo son alcanzadostras haber transcurrido miles de iteraciones. Como otralimitacin el algoritmo propuesto por [15] utiliza solamenteel 1% de la data proyectada en espacios euclideos pequeos,dicho problema ser resuelto por la propuesta presentada eneste trabajo.

    Un trabajo que toma como base el trabajo presentadopor Gomez [15], es la propuesta presentada por Zhang [16].Dicha propuesta sigue toda la metodologa implementadapor Gomez [15], eliminando todo tipo de valor constante,en pocas palabras, no utiliza una constante gravitacional, noexiste masas, no existe variacin de tiempo. La propuestadesarrollada por Zhang usa la premisa la variacionkeppleriana de distancias es la razon entre distancia ysu valor al cubo . Los resultados presentados siendobuenos, requieren de una cantidad grande de iteraciones yse trabaja sobre datos proyectados en espacios eucldeospequeos. Ambas propuestas [15] y [16] tienen un tiempo decomplejidad de O(N).

    Debemos considerar que la aplicacin de la fuerzagravitacional es ampliamente utilizada en varias areas.Existen investigaciones que explican el uso de dicho factorpara la generacin de mapas autorganizativos [17], clusteringjerrquico [18], bsqueda avanzada [19]. Sin embargo soloestos tres trabajos usan la fuerza gravitacional para resolver

  • el problema de clusterizacin , es por esta razn que estetrabajo toma como base dichos algoritmos para proponer unoque trate de resolver el problema de tiempo, velocidad yrobustez.

    III. LA TEORA DE LA NEBULOSA PROTOSOLAR (SNDM)

    A continuacin se describe la teora que explica como lossistemas solares son formados a partir de una nebulosa de gasy polvo primordial. Como es que la fuerza de gravedad actasobre pequeos objetos planetesimos provocando el impactode unos con otros, lo que favorece la constitucin gradualde estructuras cada vez mayores que evolucionron y dieronlugar a los embriones planetarios. En cada regin del discocomienza a dominar un solo gran embrin (protoplaneta).Estos son los cuerpos ms grandes que terminan atrayendo losfragmentos ms pequeos, de forma que barren todo lo quevan encontrando en su rbita al ir colisionando con ellos. Laalgoremacin de estos cuerpos mediante impactos sucesivospermiti ms tarde la aparicin de los planetas y satlites.Adems las colisiones entre dichos cuerpos estableciron lacomposicin rocosa y gaseosa de los planetas.

    A. La Nebulosa Protosolar

    La teora de la nebulosa protosolar SNDM sostiene queel Sol se form a partir del colapso gravitacional de unfragmento de nube molecular gigante de varios aos luz dedimetro. Debdo a la conservacin del momento angular, lanube presolar empieza a girar ms rpido conforme colapsay se enfra. El material dentro de la nube se comienza acondenzar incrementando la colisin de las partculas y laenerga cintica se convierte en calor. De esta manera lazona central en la que se acumla la mayor parte de lamasa se calienta mucho ms rpido que la regin externa.La competicin entre gravedad, preson del gas, los camposmagnticos, y la rotacin da lugar a la contraccin de lanube en un disco protoplanetario de unas 200 AU de dimetro.

    En el centro del disco se forma entonces, una protoestrelladensa y caliente. En un perido de unos 50 millones de aos,la temperatura y la densidad en el ncleo de la protoestrellaaumentan de manera sosteniada hasta que el hidrgenocomienza a fusionarse, lo que marca la entrada del Sol en suprimera fase de existencia, la la secuencia principal. Mayorinformacin acerca de la formacin de estrellas es revisadaen [20]. La evolucin de discos protoplanetarios es mostradaen [13], [21], [22], y [23]. Informacin ms detallada puedeser encontrada en libro de [24] Protostars and Planets III.

    Los planetas se forman entonces a partir del disco protosolarremanente que orbita alredededor de la nueva estrella recin

    Fig. 1. Estrella jveb tpica de dos salidas, conocida por ser una protoestrellabinaria, con un disco solar de un rdio de aproximadamente 10 AU y unamasa de unos 0.05 masas solares. [25], [26]. Se puede Observar a grandesrazgos como esta formado un disco de acrecin y las proporciones del mismorespecto a la protoestrella.

    formada a travs de un mecansmo conocido como acrecon.Las partculas del gas colisinan entre s de manera inlasticaformando agregados cada vez mayores. En cuanto alcanzantamaos lo suficientemente grandes su atraccin gravitatoriafavorece su acumulacin. Esto da lugar a objetos que rondanlos 5 kilmetros de dametro denominados planetsimales.Los cuales incrementan gradualmente su tamao al colisionarentre s y con objetos ms pequeos, creciendo a un ritmode varios centmetros al ao a lo largo de varios millonesde aos. Ver Figura 1. Los cometas y los asteroides se creeque son planetsimales sobrantes de la formacin del sistemasolar.

    B. Planetsimos

    Una definicin formal sobre planetsimos es presentada acontinuacin:

    Los planetsimales son objetos slidos, que surgen duranteel proceso de acresin planetaria, cuya fuerza interna es

    dominada por su propia gravedad y cuyas dinmicasorbitales no son significativamente afectadas por la friccindel gas. Esto corresponde con un tamao aproximado de un

    1 kilometro en la nebulosa solar.

    Este trmino tambin es usado actualmente para nombrara cometas, meteoritos y cuerpos similares. Tambin essabido que los cuerpos ms pequeos que los planetsimoscaen en un Movimiento Bowniano en el gas lo que originalas colisiones y permite el pegado entre ellos. Muchosplanetesimos eventualmente se rompen en colisiones violentas

  • Fig. 2. Los granos de polvo se sitan lentamente en el plano central de lanebulosa debido al componente vertical de la gravedad solar. Esto forma unacapa slida y muy rica en minerales. [30]

    tales como 4 Vesta [27] y 90 Antiopia [28] , solo unoscuantos sobrevivenn para continuar creciendo y convertirseen planetas.

    Hace cerca de los 3.8 billones de aos despus delperiodo denominado LHB muchos de los planetsimos fueroneyectados fuera del sistema solar. Lo que actualmente formala Nube de Oort, o colisionron, debido a su gran fuerzagravitacional, con los planetas gigantes tales como Jupiter yNeptuno. Algunos fueron capturados como lunas tales comolas lunas de Marte, Phobos y Deimos, y otros muchos comolunas de los planetas gaseosos gigantes.

    Cuatro etapas son descritas en la creacin de planetesimales.La etapa inicial es la condensacin de partculas de polvodel gas de la nebulosa solar al disminuir su temperatura.Estas partculas de polvo se sitan en un disco muy delgadoel cual es gravitacionalmente inestable, ubicado en el planocentral, en un tiempo aproximado de 10000 aos [29]. [30].Ver figura 2 y 3. Una primera generacin de planetesimos,quienes tienen un rango de radio no mayor a 100 metros,son formados del disco de polvo por el colapso gravitacionaldirecto de densidades slidas. El disco resultante, compuestopor la primera generacin de planetsimales contina siendoinestable, y los planetsimos son agrupados en clsters quecontienen aproximandamente 10000 elementos.

    En la escala de unos pocos miles de aos, la contraccinde estos planetsimos forman una segunda generacin deplanetsimales que tienen un radio de unos 5 kilometros.Dichos planetsimos siguen colisionando de manera directahasta llegar a tener el tamao de un protoplaneta el cualya tendr una gravedad propia y un tamao de unos 100kilometros de dimetro.[31], [12]. Cabe destacar que todoslos planetesimos y el polvo se encuentran bajo la influenciadel viento solar generado por accin de la photoevaporationcausada por los rayos ultravioletas del Sol.

    C. Formacin de los embriones planetarios, Acrecin Grav-itacional

    Las rocas mas masivas atren gravitacionalmente otras

    Fig. 3. El viento solar, el cual escapa por accin de la photoevaporation porlos rayos ultravioletas, genera una friccin en la capa generada, lo cual haceque esta tenga una contextura consistente. [30]

    rocas y polvo, formando planetsimos de varios km detamao (t 1 millon de aos)

    Esta etapa inicia cuando la mayor cantidad del materialslido a sido formado en planetsimos de pocos kilmetrosde dimetro. Como esos cuerpos ya han sido formadoses poco importante su tamao, lo que importa es que loscuerpos sean lo suficimiente grandes gravitacionalmentepara perturbar a sus vecinos ms cercanos. Las colisionesentre dichos cuerpos conllevan a la acrecin a menos que lavelocidad del impacto sea ms alta que velocidad de atraccingravitacional del objetivo, o el impacto se de con un ngulode incidencia. [32], [33].

    Un planetesimal acrece de sus hermanos en una tazaque depende del nmero de objetos por unidad de volmeny la velocidad del planetesimal velocidad relativa Vrel a losotros objetos. Si la Vrel es alta, un planetsimal colisiona solocon los objetos que pasan directamente en frente de l. Sila Vrel es pequea, la gravedad del planetesimal atraer elmaterial ms distante hacia s mismo. Este foco gravitacionalincrementa la fecuencia de las colisiones. No tan a menudo,los planetsimos pasan sin colisionar, pero su trayectoria seve cambiada por la interaccin de las gravedades. El efectoacumulativo de muchos encuentros cercanos determina lavelocidad del planetesimal relativa a otros objetos en lanebulosa. Cuerpos muy grandes tienden a tener velocidadescortas y viceversa, este estado se le denomina friccindinmica. Ver Figura 4. Todo sucede mientras la friccindel gas realiza esfuerzos para determinar las rbitas de losplanetesimos siendo estas circulares y coplanares, reduciendola Vrel .

    Inicialmente los plantsimos devran vorazmente objetospequeos. Conforme estos van creciendo la velocidad Vrel vadisminuyendo y el foco gravitacional se vuelve muy efectivo.Los cuerpos mas grandes son denomidandos embrionesplanetarios, aquellos que crecieron ms rpidamente queotros en un proceso llamado crecimiento descontrolado. Estecrecimiento descrontrolado disminuye cuando los embriones

  • Fig. 4. Los cuerpos grandes tienden a tener una velocidad relativa baja comoresultado de los nmerosos encuentros gravitacionales. Cuando cuerpos muylargos pasan cerca de otros sus trayectorias son centradas por su atraccingravitacional. Los cuerpos pequeos vuelan tan rpido que no son afectadospor su atraccin mutua y por ende crecen mas rpidamente. [30]

    planetarios se vuelven cerca de 100 veces ms masivos queun planetesimo tpico. Es entonces que las perturbacionesgravitacionales propias del planetsimo determinan la Vrelantes que las perturbaciones de los otros planetsimos [34].

    La acrecin entra entonces en un rgimen autoreguladollamado crecimiento oligrquico. Los planetsimos continancreciendo ms que otros plantesimos. Pero los embriones enregiones vecinas del disco son forzados a crecer a una tazasimilar. Cada vez que un embrin se vuelve ms codicioso,los eventos conspiran para permitir a todos los embrionescercanos el alcanzarlo. Mientras ms masivo se vuelvaun embrin, perturba mas fuertemente a los planetsimoscercanos aumentado de este modo la Vrel de estos. Entoncesel foco gravitcaional es reducido y los embriones crecen maslentamente de lo que lo hara un embrin pequeo.

    Como en toda oligarqua, cada embrin marca una reginde influencia, o zona de alimentacin en el disco. Una zonade alimentacin es una regin anular de un acho de 0.001AU. Una combinacin de friccin dinmica y ocasionalesinteracciones gravitacionales entre embriones vecinos actanpara mantener esos cuerpos ampliamente espaciados. Cadaembrin crece de su zona de alimentacin, dando a losembriones composiciones qumicas distintas. El crecimientooligrquico tiene una duracin de 0.1 a 1 millon de aos.Desde el tiempo cuando los planetsimos aparecen en grandescantidades. [35], [36]. Esta etapa termina cuando el nmerode planetsimos disminuye tanto que ellos no pueden contenerms las accines de los embriones. Con la muerte de losplanetsimales, la friccin dinmica se apaga. Los embrionesse alejan ms all de sus zonas de alimentacin y de loscolapsos mencionados anteriormente. Entonces los cuerposcomienzan a interactuar fuertemente y chocan entre s. Laacrecin de los planetas ahora entra en una larga fase terminal

    Fig. 5. Resultados de simulaciones numericas de la etapa final del proceso deacrecin de los planetas interiores. Se muestran dos simulaciones realizadasen [38]. Para esto se divide la nebulosa en cuatro zonas diferentes de material,los cuadros de pie representan a los planetas y estos estan en proporcin consu rdio. En cada cuadro se muestra la cantidad de material diferente en cadaplaneta, lo cual nos sirve como prueba resultante del proceso de acrecincataclismica. [30]

    llamada acrecin cataclsmica.

    D. De embriones a planetas, Acrecin Cataclsmica

    Embriones planetarios colisionan para formar los planetasrocosos y los ncleos de los planetas gaseosos. (t 3 - 200millones de aos)

    La etapa final de la acrecin planetaria envuelve unascuantas docenas de embriones comparadas con la masa Lunao Marte (0.01 - 0.1 de la masa de la Tierra). Perturbacionesgravitacionales entre los embriones incrementan susvelocidades relativas. El foco gravitacional se vuelvedbil y la taza de acrecin decrece dramticamente. Con eltiempo, los embriones se dispersan entre s hacia el interior oel exterior, y el orden radial establecido durante el crecimientooligrquico se combina. Los planetas finales son una mixturade material de una amplia regin de la parte interior dela nebulosa. Aun cuando cada planeta se alimenta ms delmaterial de su zona local la mixtura es diferente para cadaplaneta [37] Ver Figura 5. Por ejemplo la Tierra y Venus estacompuestos por una docena o ms de embriones planetarios,sin embargo Marte y Mercurio contienen material de unospocos.

    Tras este perido solamente sobrevivirn aquellos que sernlos planetas finales que orbiten a la estrella central (Sol).Una explosin, que lmpia de todo tipo de impurezas alsistema, es generada al final de la creacin de la estrellacentral. Creandose la actal Nube de Oort. Esta ltima etapaes altamente catica. Dependiendo del resultado indivualde eventos tales como si un encuentro cercano entre dosembriones resulta en una colisin de los mismos. La escala

  • de tiempo depende en s la nebulosa de gas sigue presente.En presencia de una nebulosa de gas con masa mnima,la Tierra puede haber sido formada en solo 5 millones deaos [39]. En la ausencia de cantidades significantes de gas,la Tierra tomara aproximadamente 100 millones de aosen formarse, segn simulaciones nmericas en el trabajopresentado en [38],[40]. Los planetas interiores acreciern deplanetsimos que actualemente se encuentran en el cinturnde asteroides. Estos planetsimos tienen una configuracindiferente a aquellos formados cerca del Sol. Cabe destacarque el cintron de asteroides es una fuente importante de aguay otros materiales voltiles que ahora existen en la Tierra [41].

    Durante esta etapa algunos embriones caen al Sol despusde perderse en el cinturn de asteroides. Colisiones a altavelocidad entre embriones conllevan a la fragmentacin delos mismos. estas velocidades son mucho ms altas cercade Sol. Lo cual convirto a Mercurio en blanco de mltiplesimpactos, explicando adems su tamao. Una fraccin decolisiones entre embriones eyectan una cantidad sustancialde material dentro de una orbita alrededor del nuevo objetoformado [40]. Por ejempo , la Luna fue formada a partir delos escombros que orbitaban la tierra despus de que estasufriera el impacto de un embrin del tamao de Marte [42].

    Se puede observar que el proceso de creacin de losplanetas a partir de una nebulosa primordial es un procesoaltamente complicado. Pero se puede apreciar como es quela naturaleza encuentra un proceso relativamente sencillopara algo tan complejo. De esta manera usaremos unametfora de este proceso para poder abstraer el como lanaturaleza se encarga de hacer clsters (planetas) a partirde grandes cantidades de materia de una manera eficiente yrpida (en unidades astronmicas). En el siguiente captulomostraremos el algoritmo base abstrado de la SNDM descritaanteriormente.

    IV. PROPUESTA

    Se procedere a mostrar el diseo del nuevo algoritmopropuesto. Mostrando la analoga de cada etapa descrita enla SNDM con nuestro algoritmo. En cada etapa descritase mencionarn los operadores y las mtricas usadas parapoder validar los clsters generados de manera adecuada. Sepuede notar, finalmente, que el algoritmo consta solamentede dos fases poniendolo a la par con otros algoritmos yaimplementados.

    A. Nebulosa Protosolar - Inicializacin

    Dado un nmero n de patrones S = {(x0,x1,x2, ...,xn) / n R}. Que representan a un conjunto de datos de entrada,

    tales como imgenes, texto, entre otros. Cada patrn xies representado mediante un vector carcteristico de mcaractersticas definido F = {( f0, f1, f2, ..., fm) / m R}

    Una partcula es definida como la tpla P(xk,C), dondexk es el patrn que la partcula representa. El contenedorasociado, c de patrones xk es definido debido a que cadapartcula esta propensa a entrar en movimiento y acretar mspatrones a su contenedor asociado C con un centrode c.Debemos notar que cada partcula es inicializada estableciendosu xk como el primer patrn en c. Adems cada partculaposee un identificador nico y un radio.

    B. Proceso de Acreccin Gravitacional

    Sea g0 el coeficiente de gravitacin universal, actualmentecon un valor de g0 = 6.66E 11 . Se define una funcin dereduccin de dicho coeficiente como:

    g(t) = g0 (1t ) , 0 1

    Dicha variacin es establecida ya que con el paso deltiempo el valor de la constante gravitacional se reduce en elunvierso. El Big Crunch supone que todo el sistema en eluniverso llegar nuevamente a ser una partcula debido a lainteraccin entre la fuerza gravitacional de los cuerpos. Lafuncin de variacin propuesta, al reducir el coeficiente degravitacin, permite adems evitar dicho fenmeno y podervariar el coeficiente incial de gravitacin para que de estamanera se pueda aumentar y/o reducir el tiempo de ejecucinel algoritmo.

    Se sabe que la fuerza de atraccin gravitacin universal,depende del coeficiente g(t), las masas y la distancia entredos cuerpos i y j. La fuerza gravitacional de una partcula iinfluenciada por una partcula j se define como:

    Gi, j(t) = g(t) im jmI jc icI2

    Se realiza una modificacin para que esta pueda ser usadaen los clsters. Puede existir el caso de solapamiento enel cual dos patrones sean completamente iguales pero conidentificadores distintos, en dicho caso un valor k es agregadoa la distancia para evitar inconsistencias en el calculo. Dichovalor puede ser establecido como k 1, de esta manera elresultado final no se ve afectado. Tomar en cuenta que alinicio del algoritmo cada partcula es en potencia un clster,algo muy comn en los algoritmos de clusterizacin masivos.La nueva ecuacin gravitacional se define como:

    Fi, j(t) = g(t) im jmI jc icI2+ k

  • k R, k 1 i, j S

    La segunda Ley de Newton establece que: El cambiode movimiento es proporcional la fuerza motriz impresa yocurre segn la lnea recta a lo largo de la cual la fuerzase imprime. Dicha ley es utilizada para poder clcular laaceleracin de cada partcula en el sistema. Se define entoncesque la aceleracin de una partcula i influenciada por unapartcula j es:

    Sea a =Fm, reemplazando ai, j =

    Fi, jmi

    El vector aceleracin se define como:

    ~a(t) =a(t) ~dI~dI

    Siguiendo con las leyes de movimiento, el desplazamientopara un movimiento acelerado esta definido:

    d = v0 t+ ~a t2

    2

    Para poder dar un comportamiento estocstico al sistema lavelocidad incial es nula, v0 = 0. Al reemplazar la aceleraciny la velocidad se la ecuacin antes definida, se obtiene elcoeficiente de desplazamiento que tendr una partcula i haciauna partcula j.

    d(i, j, t) =g(t) jm t2

    (2 I jc icI3)+ k

    Puesto que la masa es inversamente proporcional almovimiento de una particula, el coeficiente de movimientodebe ser dividido por la masa de cada partcula. Teniendocomo resultado.

    d(i, j, t) =g(t) jm t2

    [(2 I jc icI3)+ k] im

    Finalmente el desplazamiento de una partcula i hacia unapartcula j representada bajo un vector con direccin, estadefinida mediante la ecuacin:

    D(i, j, t) = ( j i) d(i, j, t)D(i, j, t+1) = D(i, j, t)+( j i) d(i, j, t)

    Un muestreo aleatorio es realizado para poder determinarla interaccin entre las partculas del sistema. Sean dospartculas i y j ambas se desplazan segn el coeficientegravitacional en direcciones opuestas. Cuando la fuerza

    gravitacional es alta, el desplazamiento ser alto. Por ende sedebe tener en consideracin una posible colisin directa. Estoes fcil de reparar al establecer que:

    Si D(i, j, t) a( j i), D(i, j, t)/2

    Lo cual establece una colisin directa no elstica entrepartculas. Segn la teora de la SNDM y como en todoalgoritmo de clusterizacin masivo. Cada clster debera serusado como un atractor en potencia. Un nuevo concepto espor esta razn introducido. Se define como el lmite de roche,a la mnima distancia que debe existir entre dos cuerpos paraque uno no sea atrado por el otro y entren en proceso decolisin.

    El limite de roche para dos cuerpos lquidos con radioR y r, respectivamente. Se define como:

    Ll = 2.456 R (Rr )1/3

    Mientras que para cuerpos rgidos de masas M y m, cambiaa:

    Lrig = R (2 Mm )1/3

    Cabe mencionar que para cada caso el lmite de roche decuerpos muy pequeos esta definido como: Ll = 2.5 R yLrig = 1.44 r, respectivamente.

    Dicho valor puede ser establecido por el usuario y determinarel nivel de coalescencia de los clsters en el sistema. Porconvencin se establece que el lmite para cuerpos rgidos esde 1.44 lr, donde lr es el valor ingresado por el usuario. Unavez que una partcula entra en la condicin antes especificada,dicha partcula es retirada del sistema para ser insertadadentro del contenedor del clster al que pertence. Como pasosiguiente, la partcula que quedo en el sistema tendra el valormedio de la distancia entre i y j.

    limiteRoche I jc icI2

    Conforme un clster se va moviendo en el sistema y debidoa la interaccin con otros clsters ciertos elementos sondispersados fuera del mismo. Pudiendo agruparse en nuevosclsters. Este comportamiento es modelado mediante el ndicede covarianza de cada clster, al que denominaremos comoradio.

    radioi =1m

    m

    k=0

    IC[k] cI

    Si IiCI 2 radio, S(i)

    Esto quiere decir que s una partcula i se encuentra msaleajada que el ndice de covarianza del clster al que

  • pertenece, entonces deber ser reinsertada en el conjuntoS que contiene a todas las partculas para que pueda seracretada por otro clster o formar el suyo. Dicha dinmicarepresenta la interaccin del viento solar en el modelo fsico.

    C. Proceso de Acreccin Cataclsmica

    Despus de un determinado nmero de interaciones, llegaun momento en que las partculas dejan de moverse y sesitan en su espacio final. Si el algoritmo contina iterando,se llegar a un bigcrunch al cabo de miles de iteraciones.Sin embargo, una vez llegado a un punto de estabilidad en elsistema se procede a realizar la acrecin de estos subclustersen clusters de mayor tamao.

    Para conseguirlo se establece un valor de entrada minDist,que actuar como valor de segmentacin y unin. Sea S elconjunto de partculas parcialmente acretadas, aquellas cuyadistancia sea menor al valor minDist sern acretadas pordicho clster. De esta manera se consigue que el algoritmosea ms adaptativo.

    Si, S j S/IS jSiI minDist S j(Si)

    Al final de este proceso bajo una cantidad mucho menor deiteraciones, se obtendr el nmero de clsters automticamenteen un tiempo mucho menor. Tambin cabe resaltar finalmenteel uso de un valor de limpieza de ruido cr que se encargarde filtrar a aquellos clsters cuya cantidad de elementos seamenor al valor cr, ruido del sistema. Se define como ruidodel sistema aquellas partculas que no pertencen a ninguncluster que estando lo suficietemente alejadas presentan unmovimiento mnimo hacia las demas partculas en el sistema.

    Siim cr, S.delete(i)

    V. IMPLEMENTACIN Y RESULTADOS

    A. Anlisis de complejidad

    El tiempo de ejecucin del sistema puede estimarsefcilmente que es O(log2n) puesto que durante cada iteracinel muestreo de cada partcula permite que el conjuntoinicial S de elementos se reduzca. El clculo del indice decovarianza de cada clster se realiza de manera incremental,por ende el tiempo de clculo no es significativo. Loscentroides de cada cluster son calculados conforme estosvan moviendo durante su recorrido. Es asi que se presentaun aprendisaje hebbiano para todas las partculas, lo cual

    Propiedad Algoritmo OtrosComplejidad O(logN) O(N2logN)

    Resultado final Depende de parmetros Un gran clusterDinmica Mvil Esttica

    TABLE ICOMPARACIN DE LA PROPUESTA CON OTROS ALGORITMOS

    ALGOMERATIVOS.

    convierte al algoritmo en un sistema completamente dinmico.

    Al presentar la segunda etapa del algoritmo. La cantidad deinteraciones para obtener resultados favorables se reduce, enpropuestas anteriores la cantidad de iteraciones necesariases extraordinariamente grande. Sin embargo en este trabajodicho nmero se ve reducido y depende del valor minDistque dar el nivel de agregacin de los clsters. A mayorcantidad de iteraciones menor la cantidad de planetsimospor acretar mayor el nivel de coalescencia de los clustersfinales. Debemos notar adems que el algoritmo no utilizaninguna estructura avanzada. Solo es necesitada un vector departculas. Esto para evitar un uso excesivo de recursos.

    B. Comparacin con otros algoritmos

    En el trabajo propuesto por Jain [5], se muestran tcnicasde las cuales se puede decir que este algoritmo se clasificacomo una tcnica aglomerativa. En la tabla I se muestralas similaridades entre este algoritmos y otros algoritmosaglomerativos.

    Este algoritmo se inicia con n diferentes clsters cada uno conun nico patron, al igual que todos los algoritmos masivos. Encada iteracin, ms de dos clsters pueden ser unidos si dospuntos seleccionados aleatoriamente son lo suficientementecercanos, en comparacin con otros algoritmos aglomerativosdonde siempre se unen dos elementos.

    C. Diferencias entre algoritmos similares

    Aunque este algoritmo usa la fuerza gravitacional para lageneracin de clsters al igual que los trabajos presentadospor [14], [15] y [16], existen diferencias establecidas entreellos. La tabla II permite resumir dichas variaciones.

  • Propiedad Propuesta Wright Gomez ZhangComplejidad O(logN) O(N2) O(N) O(N)

    Parada Nro Iter Nro Part. Nro Iter Nro IterNro de part. Var Var N Var

    Masa Var Var 6 6 Gravedad Dpnd. m-t Dpnd. masa Const Const

    TABLE IICOMPARACIN DE LA PROPUESTA CON OTROS ALGORITMOS SIMILARES.

    Fig. 6. Se puede observar como la fuerza de gravedad es reducida mediantela funcin de reduccin logartmica propuesta en el captulo anterior. Dichafuerza se mantiene con una reduccin uniforme sin llegar a ser nula, permi-tiendo que las partculas pasado un tiempo se establescan en una posicinconcreta.

    D. Parmetro de fuerza gravitacional

    Un parametro importante en el algoritmo es la constante defuerza gravitacional. A diferencia del trabajo de [15] y [16]en los cuales si este valor es demasiado grande crea solo ungran clster y si es pequeo no crea ni uno. En esta propuestaestablecer una funcin de decrecin logartmica (ver figura6 se evita ese problema. Esta nueva propuesta permite unbalance, si en caso el parmetro inicial es grande, ayudar enla formacion inicial y no se ver afectado el algoritmo puestoque nuestra ecuacin de movimiento depende adems de lasmasas. Finalmente cabe resaltar que en la propuesta de [14]no se utiliza una constante de fuerza gravitacional.

    E. Parmetro de variacin de tiempo

    Cuando los patrones se encuentran dispersados de maneramuy distante la fuerza de gravedad ser muy pequea, porende el movimiento de las partculas tambin lo es. Estefenomeno es algo muy comn en el modelo fsico en elcual nos basamos y es la razn que explica los grandesperiodos hablando de millones de aos. Dicho problemapuede ser evitado estableciendo un valor de variacin detiempo. Sin embargo se debe tener cuidado, pues si este valores demasiado alto hara que todas las partculas se acretenformando un gran clster, por esta razn se recomienda unvalor dos digitos menor al mximo de todos los elementos.

    F. Parmetros de acrecin

    A lo largo de la propuesta se debe establecer dos parmetrospara poder generar los clusters, dichos parmetros no sontan importantes pero si significativos. Determinan el nivelde segmentacin. Si son demasiado grandes generarn malosclsters. Tras los experimientos realizados , se propone queel valor de acresin sea de un 10% mientras que el valorminDist de un 20% para la obtencin de resultados favorables.

    G. Implementacin

    El algoritmo fue implementado en su totalidad haciendouso del Lenguaje C++. Se uso el esquema de programacingenrica y conceptual. Adems de un uso mesurado detemplates para clculos estticos realizados mediantemetaprogramacin. Todo lo anterior fue realizado para teneruna programacin segura y asegurar de esta manera losresultados obtenidos.

    H. Resultados

    Para la realizacin de los resultados fueron generadasciertas pruebas y comparadas con algoritmos como kmeans, yel clustering gravitacional propuesto por [15] y [16]. Los datasets utilizados fuern extraidos del conjunto de datasets paraclustering de University of Eastern Finland de la facultad deSpeech and Image Processing Unit. Se realiza la comparacinde cada prueba con un kmeans. Mientras tanto cabe mencionarque para efectos de visualizacion todos los patrones fuernproyectados usando al herramienta PEX-Image, y luego deobtener la reduccin de dimensionalidad se procedi a laejecin de algoritmo propuesto.

    Las figuras 7, 8, 9, y 10 fueron las pruebas realizadaspara el dataset S1, que cuenta con 5000 patrones esparcidosen una imagen de 1000x1000. La prueba consisto de un totalde 300 iteraciones y el proceso de unin. Un coeficiente degravedad de 100, una taza de acrecin de 10 y 20 y un valorde limpieza de ruido en un rango de [0-300] para eliminaraquellos elementos que posean una cantidad menor de datos.

    Continuando en las figuras 11 y 12, son el resultado deaplicar el algoritmo al dataset IRIS que cuenta con 150patrones. Finalmente se realiz una prueba para clusterizacinpor forma. La imagen de entrada llamada P1, consta de 5400patrones en un espacio de 200x200 pixeles, los resultados

  • Fig. 7. Data set S1 de prueba, utilizado como entrada para la propuesta.consta de 5000 patrones agrupados en 15 clusters diferentes.

    Fig. 8. Prueba realizada con el dataset S1 de U.E.F. utilizando el algoritmoK-means, se puede observar que ciertos grupos son mesclados, esto sucedepor que el kmeans busca crear clusterings uniformes y balanceados.

    pueden verse en las figuras 13, 14, 15.

    Fig. 9. Prueba realizada con el dataset S1 de U.E.F. utilizando el algoritmopropuesto, se puede observar una correcta divisin automtica de los clsters.

    Fig. 10. Prueba realizada con el dataset S1 de U.E.F. utilizando el algoritmopropuesto. En este ejemplo se muestra la variacin de factor de limpieza deruido (0-300) y unin (minDist), se puede observar claramente que los clstersse mantenien mas solo varia la densidad de los mismos.

  • Fig. 11. Data set IRIS de prueba, utilizado como entrada para la propuesta.consta de 150 patrones agrupados en 2 clusters diferentes.

    Fig. 12. Prueba realizada con el dataset IRIS de U.E.F. utilizando el algoritmopropuesto, se puede observar una correcta divisin automtica de los clsters.

    Finalmente podemos notar que los resultados obtenidosson favorables y cumples nuestras espectativas de crear unmapa de similaridad basado en consultas. En pocas palablas,Clusters de elementos asociados entre si mismos y a su veza consultas determinadas.

    VI. CONCLUSIN

    Como hemos podido apreciar a lo largo de este trabajo.Debemos notar lo siguiente. La naturaleza nos provee desoluciones para problemas complejos. En este trabajo nosinspiramos en una teora que fue formulada hace ms de unsiglo atrs pero que actualmente ya ha sido comprobada.Simplemente estamos usando una teora de la astrofsica paraaplicarla a un contexo computacional. El universo de por si esun gran clster. Lo que se busca en este trabajo, en un aspectotrascendental, es intentar demostrar que a veces debemoslevantar la mirada al cielo para encontrar nuevas soluciones,queda mucho por descubrir y usar. Esperamos haber dadoun paso ms y de esta manera abrir la imaginacin a nuevosinvestigadores demostrando que todo aspecto aspecto naturalpuede ser usado para llegar a hacer computacin.

    Fig. 13. Data set P1 de prueba, utilizado como entrada para la propuesta.Consta de 5400 patrones agrupados en 5 clusters diferentes por forma.

    Fig. 14. Prueba realizada con el dataset P1 de U.E.F. utilizando el algoritmoK-means. Se puede observar que ciertos grupos son mesclados, esto sucedepor que el kmeans busca crear clusterings uniformes y balanceados.

    Siendo ms tcnicos. El algoritmo presentado se esperanos abra las puertas las puertas a un nuevo conjunto detcnicas para generar clustering. Seguimos adems un modeloevolutivo de mejora en los clsters sin salir del esquemabsico que nos dice que toda tnica de clustering debeposeer como mximo dos fases, por razones de eficiencia(descartamos la primera etapa pues es una inicializacin).

    Algo muy interesante que se ha podido mostrar, es laaplicacin indirecta de la teora de caos que rige sobre todocuerpo grande. Nos dimos cuenta de esto, pues de un iniciocompletamente catico llegamos a un estado de estabilidadal detenerse el algoritmo. Finalmente nuestro esquema nosprovee el poder realizar consultas esto quiere decir quetenemos varias reas de inters inmersas en ella. Inciandodesde una bsqueda por densidad, una etapa evolutiva, yuna etapa de extraccin de informacin. Finalmente al usarlas leyes fsicas de gravitacin universal se esta validandolos clsters, esto quiere decir que se genera una validacin

  • Fig. 15. Prueba realizada con el dataset P1 de U.E.F. utilizando el algoritmopropuesto. Se puede observar una correcta divisin automtica de los clsters.

    implcita constante.

    A. Problemas encontrados

    A nuestros resultados falta an establecer mejoras paraque estos sean ms exactos, pero como hemos podidoapreciar existe una tendencia natural a generar resultadosprometedores. Debemos dejar en claro que muchas mejoraspueden realizarse para generar mejores resultados tanto ella etapa de acrecin gravitacional as como en la acrecincataclsmica, dejamos por ende abierta la posibilidad denuevos cambios.

    B. Recomendaciones

    Este algoritmo es altamente paralelizable pues cada partculapuede ser vista como un hilo de evolucin. Teniendo laposibilidad de ser extendido a programacion multihebra ymasivamente paralelo.

    C. Trabajos futuros

    Como trabajos futuros podemos alegar el uso de nuevasmtricas para generar los clsters. As como el modelamientode nuevas etapas que en este trabajo quedaron fuera, como elecho de simular distintos tipos de colisiones, y formacin desatelites (sub-clusters), entre otros procesos astro-fsicos.

    Finalmente se espera realizar una implementacin paralelahaciendo uso de estrategias de paralelizacin masiva talescomo CUDA y OPENCL. Para poder realizar la paralelizacinsolamente debe ser modificada el proceso de acrecin puestoque esa es la etapa ms complicada del algoritmo.

    REFERENCES

    [1] C. Fife, Artificial neural networks 1/e, Department of Computing andInformation Systems,University of Paisley, Room L117, 1996.

    [2] B. Baran and M. Almiron, Colonia de hormigas en un ambiente paraleloasincrono. Ph.D. dissertation, 2002.

    [3] H. A. Abbass, A monogenous mbo approach to satisfability. proceed-ing of the international conference on computational intelligence formodeling control and automation, CIMCA., 2001.

    [4] E. Ozcan, A. J. Parkes, and A. Alkan, The interleaved constructivememetic algorithm and its application to timetabling, Computers andoperations research, pages 2310 - 2322, 2011.

    [5] A. K. Jain, M. N. Murty, and P. J. Flynn, Data clustering a review,1999.

    [6] J. R. Hilera and V. J. Martinez, Redes neuronales articiales. Ph.D.dissertation, Alfa Omega, Madrid, Espaa., 2000.

    [7] , Redes neuronales articiales. fundamentos, modelos y aplica-ciones, RA-MA Editorial ISBN: 84-7897-155-6., 1995.

    [8] R. Descartes, Principia philosophia, Amsterdan, 1644.[9] P. Laplace, Exposition du system du monde, Paris, 1976.

    [10] I. Kant, Allegmeine naturgeschichte und theorie des himmels. Koings-burg, 1775.

    [11] J. J. Lissauer, Planet formation, Anual Reviews Inc. Provided by NASAAstrophysics Data System, 1993.

    [12] P. J. Santamaria, Codigo de arbol para la dinamica de planetesimales,PhD thesis, Facultad de ciencias astronomicas y geofisicas - UniversidadNacional de la Plata, 2004.

    [13] D. Lin and J. Papaloizou, On the structure and evolution of theprimordial solar nebula, Royal Astronomical Society, NASA astrophysicsData System, 1979.

    [14] W. Wright, Gravitational clustering, Pattern recognition, pergamonpress vol. 9 pp. 151-166, 1977.

    [15] J. Gomez, D. Dasgupta, and O. Nasraoui, A new gravitational clusteringalgorithm, Proceedings of the third SIAM International Conference onData Mining, 2003.

    [16] T. Zhang and H. Qu, An improved clustering algorithm, Proceedingsof the third international symposium on computer science and compu-tational technology, pages 112-115, 2010.

    [17] N. Ilc and A. Dobnikar, Gravitational clustering of the self - organizingmap, Adaptative and Natural Computing Algorithms., 2011.

    [18] P. S. Bishnu and V. Bhattacherjee, Gravitational base hierarchicalclustering algorithm, ACEEE International Journal on comunication,2014.

    [19] E. Rashedi, H. Nezamabadi, and S. Saryazdi, Gsa: Gravitational searchalgorithm, Information Sciences Volume 179, issue 13, 2009.

    [20] F. Shu, S. a. lizano, and F. Adams, Astrophysics, Anual Reviews Inc.Provided by NASA Astrophysics Data System, 1987.

    [21] A. Cameron, The origin of the solar system, Ed, Dermot, S. F. Wiley,Chichester., 1977.

    [22] A. Boss, The solar nebula, Carnegie Institution of Washington, DC,USA., 1989.

    [23] S. Ruden and J. Pollack, Astrophysics, Anual Reviews Inc. Providedby NASA Astrophysics Data System, 1991.

    [24] E. Levy, J. Lunine, , and M. Matthews, Protostars and planets iii,Tucson, Univ. Ariz. Press. In press, Room L117, 1993.

    [25] R. Snell, R. Loren, and R. Plambeck, Observatios of co in l1551 -evidence for stellar wind driven shocks, Astrophysics 239, pp. 1722,1980.

    [26] A. Boss., G. Morrill, and W. Tscharnuter, Astrophysics. Anual ReviewsInc. Provided by NASA Astrophysics Data System., 1989.

    [27] D. Savage, T. Jones, and R. Villar, Ateroid or mini planet? hubble mapsthe ancient surface of vesta, Hubble Site News Release STScl-1995-20,1995.

    [28] F. Marchis, J.E.Enriquez, J. Emery, J.Berthier, and P. Descamps, Theorigin of the double main belt asteroid 90 antiope by component-resolved spectroscopy, DPS meeting 41 American Astronomy Society.,2009.

    [29] S. Weidenschilling, Dust to planetesimals, Icarus 44, 1980.[30] J. E. Chambers, Making more terrestrial planets, Icarus 152, pp. 205

    224, 2001.

  • [31] P. Goldreich and W. R. Ward, The formation of planetesimals, TheAstrophysical Journal, 183, 1973.

    [32] W. Benz and E. Asphauhg, Catastrophic disruptions revisited, Icarus142, pages 5-20, 1995.

    [33] Z. Leinhardt, D. Richardson, and T. Quinn, Direct nbody simulationsof rubble pile collisions, Icarus 146, pp. 133151, 2000.

    [34] S. Ida and J. Makino, Scattering of planetesimals bye a protoplanet.showing down of runaway growth, Icarus 106, pp. 210227, 1993.

    [35] E. Thommes, M. Duncan, and H. Levison, Oligarquic growth of giantplanets, Icarus 161, 2003.

    [36] S. Weidenschilling, D. Spaute, D. Davis, F. Marzari, and K. Ohtsuki,Accretional evolution of a planetesimal swarm, Icarus 128, 1997.

    [37] J. E. Chambers, Planetary accretion in the inner solar system, Earthand Planetary Science Letters 223, 2004.

    [38] J. E. Chambers and P.Cassen, The effects of nebula surface densityprofile and giant-planet accentricities on planetary accretion in the innersolar system, Meteoritics 37, 2002.

    [39] C. Hayashi, K. Nakazama, and Y. Nakagawa, Formation of the solarsystem, Proto-Stars and Planets III, Tucson. Univ. Ariz., 1985.

    [40] C. Agnor, R. Canup, and H. Levison, On the character and conse-quences of large impacts in the late stage of terrestrial planet formation,Icarus 142, pages 219-237, 1999.

    [41] A. Morbidelli, J. Chambers, J. Lunine, J. Petit, F. Robert, G. Valsecchi,and K. Cyr, Source regions and time scales for the delivery of waterto earth, Meteoritics 35, 2000.

    [42] R. Canup and E. Asphaug, Origin of the moon in a giant impact nearthe end of earths formation, Nature 412, pp. 708712, 2001.

    IntroduccinTrabajos RelacionadosLa Teora de la Nebulosa Protosolar (SNDM)La Nebulosa ProtosolarPlanetsimosFormacin de los embriones planetarios, Acrecin GravitacionalDe embriones a planetas, Acrecin Cataclsmica

    PropuestaNebulosa Protosolar - InicializacinProceso de Acreccin GravitacionalProceso de Acreccin Cataclsmica

    Implementacin y ResultadosAnlisis de complejidadComparacin con otros algoritmosDiferencias entre algoritmos similaresParmetro de fuerza gravitacionalParmetro de variacin de tiempoParmetros de acrecinImplementacinResultados

    ConclusinProblemas encontradosRecomendacionesTrabajos futuros

    References