Introducción. Debido a la poca evidencia sobre el modelamiento de los patrones de alimentación y actividad física (AF), basado en variables latentes, el presente estudio de revisión pretende describir las técnicas estadísticas aplicadas para modelar estos patrones en niños y adolescentes y valorar su calidad metodológica. Materiales y métodos. La búsqueda se realizó en bases de datos electrónicas (Science Direct, PubMed, SCOPUS, Web of science y Cochrane) con las palabras “diet”, ’physical activity’, children y ’latent variable’. Se incluyeron artículos que utilizaron modelos estadísticos basados en variables latentes para analizar patrones de alimentación y AF en niños y adolescentes sanos, publicados entre 2014–2019, en inglés o español. Resultados. Entre los 27 artículos seleccionados, el Modelo de Ecuaciones Estructurales (MEE) fue el más utilizado (77,78%); seguido del Modelo de Perfil Latente (7,41%), mientras, el restante, 14,81% aplican el Modelo del Factor Común, Modelo Ecológico y el Modelo de Regresión Logística Multinivel. El MEE fue aplicado a 12 de los 16 artículos con enfoque de AF, y en 7 de los 9 artículos con enfoque de Alimentación. El 48,15% de los estudios sí justificaba el uso del modelo, y el 37,04% poseen una calidad “Excelente” (cumplen el 85% o más de los ítems de STROBE). Conclusiones. El MEE fue el más utilizado para abstraer los patrones de AF y alimentación en niños y adolescentes, sin embargo, solo la mitad de los artículos justifica su pertinencia. Las guías de reporte de estudios deberían evaluar la calidad metodológica de los modelos estadísticos aplicados. Arch Latinoam Nutr 2023; 73(3)S2: 151-161.
Palabras clave: variable latente, modelos estadísticos, dieta, actividad física, niños.
. Introduction. Due to the limited evidence on the modeling of eating and physical activity (PA) patterns based on latent variables, the present review study aims to describe the statistical techniques applied to model these patterns in children and adolescents and to assess their methodological quality. Materials and methods. The search was performed in electronic databases (Science Direct, PubMed, SCOPUS, Web of science and Cochrane) with the words ‘diet’, ‘physical activity’, children and ‘latent variable’. We included articles that used statistical models based on latent variables to analyze diet and PA patterns in healthy children and adolescents, published between 2014-2019, in English or Spanish. Results. Among the 27 selected articles, the Structural Equation Model (SEM) was the most used (77.78%); followed by the Latent Profile Model (7.41%), while, the remaining 14.81% applied the Common Factor Model, Ecological Model and Multilevel Logistic Regression Model. The SEM was applied to 12 of the 16 articles with PA approach, and in 7 of the 9 articles with eating approach. The 48.15% of studies did justify the use of the model, and 37.04% were classified as “Excellent” quality (meet 85% or more of the STROBE items). Conclusions. The SEM was the most commonly used to model the PA and eating patterns in children and adolescents, however, only half of the articles justify their relevance. Study reporting guidelines should evaluate the methodological quality of the statistical models applied. Arch Latinoam Nutr 2023; 73(3)S2: 151-161.
Keywords: latent variable, statistical model, diet, physical activity, children.
https://doi.org/10.37527/2023.73.S2.017
Autor para la correspondencia: Susana Andrade, e-mail: [email protected]
A nivel mundial se estima que el 10% de la población en edad escolar sufre de obesidad y sobrepeso (1). Lo anterior es alarmante considerando que la obesidad y sobrepeso en la infancia o adolescencia es un factor de riesgo para la presencia de enfermedades no transmisibles en distintas etapas de la vida, como hipertensión, enfermedades coronarias, así como con la sintomatología depresiva. La evidencia científica señala como responsable del exceso de peso a la interacción de diversos factores como los relacionados con la actividad física (AF) y la alimentación (2).
En este contexto, gana importancia el estudio de los patrones comportamentales de alimentación y AF que se define como la serie de comportamientos, decisiones y hábitos de alimentación y de realización de actividades físicas que impliquen un gasto energético superior al metabolismo basal (3). Caracterizar estos patrones comportamentales es útil para explorar las relaciones entre el estado nutricional, los hábitos alimentarios y los fenómenos de cambio biológico, social y cultural, imprescindibles para diseñar estrategias de intervención efectivas (4). Adicionalmente, el estudio de los patrones comportamentales en la etapa escolar es de suma importancia dado que, en este periodo, los niños comienzan a tomar sus propias elecciones alimenticias y hábitos de actividad física, los cuales suelen mantenerse hasta la etapa de adultez (5).
El estudio de los patrones de alimentación y AF se suele realizar por medio del proceso del modelo estadístico, que es una forma basada en las matemáticas para a partir del conjunto de datos se identifiquen las relaciones matemáticas y probabilísticas entre variables. Los modelos estadísticos también se caracterizan por permitir generar visualizaciones de las relaciones entre las variables, lo cual permite conocer sus conexiones y a realizar predicciones (6). Dentro de los modelos estadísticos se pueden categorizar los patrones de alimentación y de actividad como variables latentes (VL). Una VL es una variable no observada, por ende requiere ser inferida a través de otras variables que sí son observados; o en otras palabras es medida indirecta (7). Para el caso de los modelos estadísticos de variables latentes (MVL), es necesaria una perspectiva amplia sobre patrones de alimentación y actividad física de riesgo en el ámbito de salud en niños y adolescentes; así como un modelo apropiado que se ajuste a la naturaleza de los datos. Sin embargo, el modelado de los patrones de alimentación y actividad física ha planteado una serie de retos metodológicos. En primer lugar, la existencia de métodos heterogéneos dificulta la comparabilidad en los resultados obtenidos y la precisión al modelar correctamente los patrones (8). Luego, la selección inapropiada del MVL usado puede poner en riesgo la validez de la técnica estadística usada, cuando se decide con base en suposiciones de que el método sea el “adecuado”, y por ende afectando los resultados (9). Finalmente, es necesario considerar que nuevas técnicas estadísticas emergen a la par del desarrollo científico, considerando el enfoque multifactorial y complejo tanto de la AF como la alimentación (10). A pesar de los vacíos mencionados, hasta lo investigado, no existen revisiones sobre cómo se han aplicado los MVL en el estudio de los patrones de actividad física y alimentación en niños y adolescentes, lo cual es necesario para valorar la calidad metodológica, estadística aplicada y que son fundamentales para garantizar alcanzar conclusiones adecuadas.
Por lo tanto, los objetivos de esta revisión de literatura fueron: a) sintetizar las técnicas estadísticas que modelen mediante variables latentes los patrones de actividad física y alimentación en niños y adolescentes; b) revisar la sustentación teórica reportada para la selección de dichas técnicas, y c) explorar el uso de estas técnicas durante el periodo de estudio (2014-2019).
Se realizó un diseño de revisión sistemática con el fin de identificar estudios publicados que incluyen el uso de modelos estadísticos basados en variables latentes para el análisis de patrones de alimentación y AF. Esta revisión sistemática se realizó de acuerdo con las directrices de Elementos de Información Preferidos para Revisiones Sistemáticas y Meta-Análisis o por sus siglas en inglés PRISMA (11).
Para la búsqueda sistemática, cinco bases de datos electrónicos fueron utilizadas: Science Direct, PubMed, SCOPUS, Web of science y Cochrane. La búsqueda incluyó sinónimos para [diet or food], [’physical activity’ or exercise], [children OR teenagers OR adolescent] combinado con [’latent variable’]. La siguiente clave de búsqueda fue utilizando: ”latent variable” AND (diet OR food OR “physical activity” OR exercise) AND (children OR teenagers OR adolescent).
Para la elegibilidad de los artículos, los estudios debían cumplir los siguientes criterios de inclusión: 1) diseños observacionales, 2) sujetos de estudio, niños de 5 a 11 años y adolescentes entre 12 y 18 años, 3) estudios en participantes sanos. 4) publicados entre 2014-01- 1 hasta 2019-11-27. 5) Lenguaje en inglés. 7) uso de modelos basados en variables latentes y 8) artículos que contengan el texto completo. Los criterios de exclusión fueron 1) estudios realizados específicamente en personas con alguna enfermedad como cáncer o diabetes, 2) resúmenes, memorias de congresos o cualquier documento que no fuese artículo científico.
Con base en los criterios de selección, se iban recolec- tando los títulos y resúmenes de los potenciales ar- tículos a incluir por dos investigadores (LP y ES). Los artículos primero eran descartados por la lectura del título, luego por la lectura del resumen y finalmente por la lectura del documento completo. Artículos que no cumplían con los criterios de selección eran descar- tados del estudio. En el caso de encontrar discrepan- cias en la decisión entre los investigadores, un tercer investigador con experiencia en el área tomaba la de- cisión final.
Una matriz en Excel fue utilizada para este proceso y se recopiló los siguientes datos: título, autor, año de publicación, población objetivo (niños o adolescentes, niños y adolescentes), tamaño de la muestra (n), ran- go de edad, tipo de modelo, criterio de selección del modelo (si se justifica el uso del modelo de variable latente o no), número de variables latentes y diseño de estudio observacional. Una síntesis narrativa fue rea- lizada para todos los estudios con el fin de analizar la información extraída y buscar patrones a partir de los artículos recopilados. Dos investigadores extraían la in- formación y posteriormente era validada por un tercer investigador. En caso de discrepancias, se realizaban diálogos para llevar a consensos sobre la información ingresada.
La calidad de los artículos incluidos fue evaluada a través del Strengthening the Reporting of Observational Studies in Epidemiology (STROBE) (12) para estudios observacionales. El STROBE fue elegido dado que ofrece guías que permiten verificar el ítem en la lista con sus especifica- ciones. Esta herramienta está compuesta de 22 ítems que recopilan información como el título/resumen, introducción, materiales y métodos, resultados, discusión y entre otra. La calificación final se presenta en porcenta- jes, con base en el reporte de los ítems. Todos los artículos fueron evaluados de manera in- dependiente por dos de los autores (SA & GS). En caso de cualquier desacuerdo fueron re- sueltos a manera de consenso.
La búsqueda mediante el uso de las palabras claves en las bases de datos dio como resultado un total de 1896 artículos. A partir de estos artículos, 46 artículos duplicados fueron eliminados, dejando 1850 artículos. A partir de la revisión de título y resumen, 1804 artículos fueron descartados por no ser relevantes para la revisión. Finalmente, se revisó el texto completo de los 46 artículos restantes, de los cuales 19 fueron excluidos por no cumplir con los criterios de inclusión planteados. Las principales razones para la exclusión fueron: estudios con sujetos de estudios diferentes (adultos) y estudios no observacionales. En la figura 1 se muestra el diagrama de flujo utilizado en el presente estudio.
Se contaron con 27 artículos seleccionados para la presente revisión sistemática. En cuanto a su origen, el 22,22% (n=6) de los estudios realizados en Estados Unidos (13–18), un 11,11% (n=3) fueron realizados tanto en Canadá (19–21), al igual que en Reino Unido (22–24); mientras que un 7,41% (n=2) correspondía a estudios en Dinamarca (25, 26), Polonia (27, 28) y Francia (29, 30), respectivamente. El 44,44% de estudios restantes correspondieron a estudios de otros países como Suiza, China (31), Singapur (32), Holanda (33), Brasil (34), Argentina (35), Corea del Sur (36), Finlandia (37) y Portugal (38). En cuanto a los diseños, el 62,96% (n=17) de los estudios recopilados corresponden a estudios transversales, mientras que el 37,04% (n=10) a estudios longitudinales.
El número de participantes en los estudios tuvo un promedio de n=1,107. Un estudio realizado en Brasil tuvo el mayor tamaño de muestra con 109.014 participantes (34); mientras que el menor tamaño fue 101 en un estudio realizado en Francia (29). Siete estudios tuvieron una muestra entre 1000 y 6000 (14,16,18,19,28,32,35), el resto de trabajos tuvo un tamaño menor a 1000 participantes.
El 25,93% (n=7) de estudios analizó a niños (5-12 años) (14,17,21,27,30,33,35), el 29,63% (n=8) analizó a adolescentes (13-18 años) (13,15,20,22,28,32,36,38) y el 44,4% (n=12) de estudios tuvo una muestra compuesta de niños y adolescentes (16,18,19,23–26,29,31,34,37,39). Solo uno no incluye a mujeres dentro de su estudio.
Respecto al enfoque de estudio, el 33,33% (n=9) de estudios determinaron patrones de alimentación (13,18,20,22,25,26,29,30,34), el 59,26% (n=16) determinaron patrones de actividad física (14,15,17,19,21,23,24,27,28,31– 33,37,39) y el 7,41% (n=2) de los estudios determinaron tanto patrones de alimentación como de actividad física (16,35). Finalmente, el porcentaje de artículos publicados a lo largo de los años fue el siguiente: 2014 con 11,11% (n=3); 2015 con 14,81% (n=4); 2016 con 22,22% (n=6); 2017 con 18,51% (n=5); 2018 con 25,92% (n=7); y 2019 con 7,41% (n=2). En la tabla 1 se resumen las principales características extraídas de los 27 artículos incluidos en la revisión.
Respecto a los modelos estadísticos aplicados, el más usado fue el Modelo de Ecuaciones Estructurales con un 92,59% (n=25); le siguió el Modelo de Análisis de Perfiles Latentes con el 7,41% (n=2). Seis del total de estudios presentaron un análisis posterior al de modelación de variables latentes, entre los que se destaca el Análisis Path (análisis de camino). En promedio, para cada estudio un total de 18 variables fueron utilizadas para construir un modelo.
En cuanto al criterio de selección, el 48,15% (n=13) de los estudios justificaron el uso del modelo de VL, a diferencia del 51,85% (n=14) que no reportaron una justificación. En los artículos transversales; más de la mitad de los estudios utilizan un criterio de selección para el uso de un modelo (58,82%). Caso contrario, en los estudios longitudinales, la mayoría no usa un criterio de selección para su modelo (17,64%).
Finalmente, el uso de los modelos a lo largo de los años se puede observar en la figura 2. El MEE es el modelo más usado durante todo el periodo de estudio, el menor porcentaje se presentó en 2014 con un 66,67%. En cuanto a los años 2014, 2015 y 2018, se puede observar que los análisis de MEE estuvieron acompañados de análisis Path para el análisis de las variables latentes originadas. Por otra parte, en 2016 y 2018 se realizaron estudios con el uso de un modelo de análisis de perfiles latentes, complementado en el caso del 2016 con una regresión logística multinomial. Finalmente, estudios que utilizan un MEE complementaron el análisis de las variables latentes con una regresión logística multinivel en 2016 y un modelo de elección múltiple continua o discreta para el 2018.
Los resultados de la determinación de calidad metodológica según los ítems de la guía STROBE indicaron que el 37,04% de los artículos considerados en este estudio poseen una calidad “Excelente” al cumplir con el 85% o más de los ítems. Más de la mitad 59,26% de los estudios poseían una calificación de “Buena” al estar en el intervalo de 70 a 85% de cumplimiento de ítems. El 3,7% de los estudios obtuvo una calificación de “Regular” al cumplir con el 50 a 70% de los ítems. Ningún estudio obtuvo la calificación de “Malo” que corresponde a un cumplimiento menor al 50%.
Este estudio tuvo como objetivo general realizar una revisión sistemática (2014-2019) acerca del uso de modelos de variables latentes para modelar hábitos
o patrones de actividad física y nutrición, en niños
o adolescentes. Un total de 27 estudios resultaron dentro de la muestra final, luego de un proceso de selección y descarte. El primer objetivo fue sintetizar las técnicas estadísticas para modelar los patrones mencionados. Se determinó que el 96,29% de los estudios emplearon el MEE, siendo el modelo más aplicado. El segundo objetivo específico fue revisar la justificación teórica reportada para el uso de los MVL usados. Se encontró que la mayoría de los artículos, 52,4% presentaron una justificación sobre el modelo empleado. El último objetivo específico planteado fue revisar cómo el uso de las técnicas ha variado durante el periodo de estudio. Pese a la mayor prevalencia de uso de MEE podemos observar que en distintos años, análisis complementarios han servido para responder a los objetivos planteados y robustecer el método de análisis estadístico.
Los hallazgos de esta revisión demuestran que el 96,29% de los estudios han usado el MEE, convirtiéndolo en el modelo más utilizado a lo largo del periodo de estudio. Esto puede deberse a su marco flexible para analizar relaciones complejas entre múltiples variables, utilizando componentes gráficos (40). La mayor ventaja de los MEE según la literatura, es que permite proponer el tipo y dirección de las relaciones esperadas para que luego el mismo modelo permita confirmar las relaciones propuestas a partir de la teoría explicativa que se haya decidido utilizar como referencia (41) La variedad de software de análisis, reduce considerablemente la dificultad de implementar MEE, volviéndolo más accesible para los investigadores. Según (42), el MEE es un modelo ampliamente aplicado que ha ganado popularidad; sin embargo, a pesar de esta popularidad, los investigadores suelen equivocarse al momento de elegir este modelo (40).
En cuanto a la justificación, cerca de la mitad reportaron parámetros de selección de la técnica de modelación de variables latentes. Entre las principales razones por la cual se seleccionó el MEE, se destacan la capacidad de estimaciones más precisas al evaluar teorías que incorporan relaciones causales con diferentes direcciones en diseños no experimentales. Esto debido a que permite incorporar en el análisis posibles errores de medida en las variables (dependientes e independientes), evaluar la especificación y la bondad de ajuste de los modelos, así como la posibilidad de incluir variables de distinto tipo (discretas o continuas), utilizadas para medir constructos relacionados con la alimentación y AF (13,25,30,31). Para el caso del estudio que utilizó un modelo de análisis de perfiles latentes, la justificación se centró en posibilidad de permitir correlaciones restringidas entre los perfiles resultantes. Sin embargo, entre las condiciones metodológicas deseables para seleccionar un MEE, se destaca el examinar los supuestos de normalidad multivariada, incluir la mayor cantidad de parámetros deseables, contar con una muestra de tamaño adecuado y medidas al menos de nivel intervalar (43). La falta de sustento metodológico en la selección de una técnica que modele variables latentes, podría causar problemas en la especificación correcta del modelo, así como cargas factoriales incorrectas, dando como resultado la delimitación de variables latentes inadecuadas para probar teorías definidas, es decir variables que reflejen aspectos diferentes a los deseables (44). La rigurosidad al seleccionar un modelo debería tener un sustento metodológico y delimitarse claramente en un plan de análisis de un estudio previo a las etapas de recolección de datos con el fin de asegurar resultados válidos.
En referencia a la aplicación de las técnicas de modelación de patrones de alimentación y AF con variables latentes a lo largo del periodo de estudio, no se observa un cambio o patrón de selección. El MEE se creó de la necesidad de mayor flexibilidad en los modelos de regresión (45) y ha predominado a lo largo de los años, tanto como análisis único, como al formar parte del conjunto de técnicas estadísticas utilizadas para responder a los objetivos de cada artículo. La necesidad de responder a objetivos cada vez más complejos dentro del área de alimentación y AF, como el modelar los perfiles y comportamientos que puedan ayudar a entender las motivaciones a determinados comportamientos saludables. Sin embargo, pocos estudios proponen análisis complejos, hecho por el cual el potencial de los avances en las técnicas estadísticas y en el procesamiento de datos de los software, son subutilizados, perdiendo la calidad y rigurosidad de análisis (43).
Entre las fortalezas de este estudio, se puede indicar que el presente permite ser un punto de partida para conocer sobre los tipos de modelos usados en el estudio de los patrones de alimentación y actividad física. Adicionalmente, se reportan los resultados de acuerdo a variables como edad, diseño y país, lo que permite tener una idea de los vacíos metodológicos de conocimiento para futuros estudios. También, se siguió la metodología recomendada para realizar revisiones de literatura, así como se aplicaron herramientas estandarizadas para el reporte de estudios de revisión sistemática (PRISMA), lo que garantiza la objetividad y rigor en la metodología del estudio. Entre las limitaciones del estudio, se incluye que los modelos presentados no son analizados y comparados a nivel matemático, lo cual puede ser interesante tratarlo en un trabajo futuro.
El modelo de ecuaciones estructurales es más utilizado para el modelamiento de variables latentes en el campo de estudio de patrones de actividad física y alimentación en niños y adolescentes. Sin embargo, el fundamento teórico para su selección y cumplimiento de parámetros para su aplicación no es reportado en la mayoría de estudios. Es recomendable que futuros estudios, describan explícitamente los argumentos para el uso de modelos estadísticos, lo que es un elemento necesario para mejorar los métodos que abordan los temas de alimentación y actividad física.
Este trabajo es realizado dentro de la asignación horaria de la Universidad de Cuenca y la Universidad Politécnica Salesiana.
Los autores declaran que la investigación se llevó a cabo en ausencia de relaciones comerciales o financieras que pudieran interpretarse como un posible conflicto de intereses.
Publicado: 29/01/2024