Stomach Health > Estomac Santé >  > Stomach Knowledges > Recherches

Optimisation de la puissance de diagnostic avec la vidange gastrique scintigraphie à de multiples points de temps

Ouvrir examen par les pairs

Cet article a des rapports d'examen ouvert par les pairs disponibles.

Comment fonctionne l'examen ouvert par les pairs?
Optimisation de la puissance diagnostique avec gastrique scintigraphie vidange au Résumé
points de temps multiples Contexte
Vidange gastrique scintigraphie (GES) à des intervalles de plus de 4 heures après un repas radio marqué normalisé est généralement considéré comme l'étalon-or pour le diagnostic de gastroparésie. Les objectifs de cette étude étaient les suivants: 1) pour étudier le meilleur point de temps et la meilleure combinaison de plusieurs points de temps pour diagnostiquer la gastroparésie avec des mesures répétées de GES, et 2) pour le contraste et la validation croisée de l'analyse discriminante linéaire de Fisher (LDA), un rang la distribution à base libre (DF) approche, et le (CART) modèle de classification et de régression Tree.
Méthodes
un total de 320 patients avec des mesures de GES à 1, 2, 3, et 4 heures (h) après une norme repas en utilisant une méthode normalisée ont été collectées rétrospectivement. Résultats Aire sous la caractéristique (ROC) courbe Receiver Operating et le taux de fausse classification par jackknife validation croisée ont été utilisés pour la comparaison du modèle.
raison de la forte corrélation et une anomalie dans la distribution des données, aucune amélioration substantielle de diagnostic le pouvoir a été trouvé avec la meilleure combinaison linéaire par l'approche LDA même avec la transformation des données. Avec la méthode DF, la combinaison linéaire de 4 h et 3 h augmente l'aire sous la courbe (AUC) et la diminution du nombre de fausses classifications (0,87; 15,0%) par rapport à des points de temps individuels (0,83, 0,82; 15,6%, 25,3 %, pendant 4 h et 3 h, respectivement) à un niveau de sensibilité plus élevée (sensibilité = 0,9). Le modèle CART avec 4 GES horaires mesures ainsi que l'âge du patient était l'outil de diagnostic plus précis (AUC = 0,88, fausse classification = 13,8%). Les patients ayant un 4 h gastrique valeur de rétention >. 10% étaient 5 fois plus susceptibles d'avoir la gastroparésie (179/207 = 86,5%) que ceux avec ≤10% (18/113 = 15,9%)
Conclusions
avec un groupe mixte de patients soit mentionné avec une suspicion gastroparésie ou d'une enquête pour d'autres raisons, le modèle CART est plus robuste que les approches LDA et DF, capable d'accueillir des effets covariables et peut être généralisé pour les applications institutionnelles transversales, mais pourrait être instable si taille de l'échantillon est limité.
Contexte
vidange gastrique scintigraphie à des intervalles de plus de 4 h après un repas standardisé est généralement considéré comme l'étalon-or pour mesurer gastrique fois la vidange. Dans la pratique, une mesure horaire simplifiée du contenu gastrique résiduel est utilisé pour le diagnostic de gastroparésie défini comme retardé la vidange gastrique (GE) en l'absence d'obstruction mécanique [1, 2]. La nourriture technique mesure radiomarqué restant dans l'estomac, à intervalles d'une heure après que le patient ingère un repas standardisé [3] comme un indicateur de retard de GE. En raison des différences dans les aliments utilisés, les techniques utilisées et les paramètres mesurés avec GES, l'analyse et l'interprétation des résultats varient selon les institutions [4]. La plupart des études antérieures ont montré que retardé la vidange gastrique peut être mieux indiqué avec rétention gastrique de > 10% à 4 h après le repas, qui a été établi que le percentile 95 dans la rétention gastrique avec des volontaires sains par le biais d'une étude multicentrique [5, 6] . Comme toujours, une décision de diagnostic basé sur la distribution est arbitraire et peut inévitablement induire en erreur à cause des erreurs de classification. Il est rapporté que l'approche simplifiée a une spécificité de 62% et une sensibilité de 93% [7]. D'autres utilisent le pour cent de rétention à 2 h que les mesures cliniques de routine de GES [8], suggérant GES à 2 h ou 3 h pourrait être le meilleur point de temps individuel avec une puissance de diagnostic plus élevé. Cependant, le pourcentage de rétentions gastriques à différents points de temps peuvent également être soumis à l'âge du patient et le sexe [5]. Le manque de standardisation dans la conduite de GES ainsi que des différences dans l'analyse quantitative utilisées dans diverses institutions peuvent limiter l'utilité clinique du test, et présente des problèmes si les données institutionnelles transversales doivent être évaluées. En 2008, au nom de la Neurogastroentérologie américaine et la motilité et de la Société de médecine nucléaire, des chercheurs de 13 institutions médicales américaines ont publié conjointement une déclaration de consensus pour la normalisation des GES dans les institutions [4]. En outre, les questions nécessitant une enquête plus approfondie ont été identifiés par le consensus qui comprennent: 1) l'utilisation de 3 h par rapport à 2 et 4 h résultats pour la détection de retard GE; et 2) l'utilisation de points de temps multiples (2 et 4 h) par rapport à des valeurs 2 ou 4 h simples pour une meilleure compréhension de la signification clinique des résultats discordants entre 2 et 4 h scans. Méthodologie de sur l'utilisation différents marqueurs de diagnostic pour détecter les maladies ou d'évaluer les risques liés à la santé a été un domaine de recherche actif [9-11]. Avec les progrès rapides des technologies génomiques et protéomiques, l'accent mis sur la détection des maladies à base de biomarqueurs et l'évaluation des risques a évolué à partir d'un biomarqueur unique à un panel de biomarqueurs puisque différents marqueurs peuvent être sensibles aux différents aspects de la maladie [12]. On fait valoir que, par rapport à un marqueur clinique ou génétique unique, un panel de marqueurs multiples peut contenir un niveau plus élevé d'informations discriminatoires, en particulier à travers de grandes populations hétérogènes de patients et pour les maladies multicellulaires complexes. Ceci est important car l'utilisation de plusieurs marqueurs simultanément pourrait conduire à une nouvelle mesure de diagnostic avec une sensibilité plus élevée [11].
Lorsque plusieurs marqueurs sont continus et distribués normalement, LDA Fisher fournit la meilleure combinaison linéaire qui maximise la sensibilité sur toute la plage de spécificité uniformément dans le cadre du modèle de distribution normale multivariée [11]. Lorsque les valeurs des marqueurs dévient de la normale, une transformation de puissance Box-Cox peut être utilisé pour améliorer l'ajustement normale [13]. Cette approche a été trouvé efficace pour estimer les courbes AUC et ROC si les distributions de véritables sous-jacentes, soit sur l'original ou sur une échelle transformée, sont proches de la normale multivariée [11]. Dans le cas contraire, une distribution approche libre de rang en fonction peut être appliquée. Les aspects théoriques de la meilleure combinaison linéaire pour les biomarqueurs sont bien rapportés [[9, 11, 14-19] et [20]]. LDA Fisher est plus facile à calculer, alors que l'approche DF est plus robuste à la déviation de la distribution normale, mais est informatiquement prohibitif si plus de deux marqueurs sont impliqués [19]. Nous avons utilisé les estimations des paramètres de LDA comme un point de départ pour la recherche de grille avec DF si l'espace marqueur va au-delà bilatéral. Le modèle de CART, d'autre part, fournit une autre approche pour optimiser la puissance de diagnostic lorsque des marqueurs sont multidimensionnelles [21-23]. Plutôt que de créer une nouvelle mesure de diagnostic comme LDA ou DF, CART utilise un processus séquentiel pour identifier l'ensemble des variables prédictives, dans leur échelle d'origine, qui différencient le meilleur des groupes parmi la variable des résultats d'intérêt. Il est particulièrement utile quand il y a beaucoup de variables prédictives qui sont fortement corrélés. Il est informatiquement moins intensive et moins facile à interpréter, mais peut être instable si le modèle est insuffisamment formé avec des données limitées.
La plupart des études antérieures se concentrent sur dériver la meilleure combinaison de marqueurs qui maximise l'ASC pour les sujets dont le statut maladie a été connue [11 , 14-20]. On ne sait pas si la puissance de diagnostic pour une telle combinaison étend à la population avec des valeurs de marqueurs connus, mais l'état de maladie inconnue ou à la population dont les valeurs marqueur ne sont pas utilisés pour dériver les paramètres de diagnostic. Avec un repas standardisé (voir Matériels et méthodes) et la technique horaire de GES (cinq séances de 2 minutes imagerie) sur une période de 4 heures, moins de temps de la caméra est nécessaire alors que les résultats peuvent être reproductibles de l'hôpital à l'hôpital. Ce document évalue les options statistiques qui permettent d'optimiser la puissance de diagnostic avec GES mesures à quelques points de temps. Utilisation du diagnostic clinique primaire, défini par des symptômes tels que des nausées, des vomissements, la satiété précoce, plénitude postprandiale, des douleurs abdominales et de la douleur, en plus de preuves de retard de vidange gastrique en l'absence d'obstruction gastrique mécanique, comme le véritable état de la gastroparésie Méthodes de, cette étude met l'accent sur la recherche des paramètres de la meilleure combinaison linéaire de GES à différents points de temps avec des données de formation, puis, enquête et croisée valide ses performances dans les données d'essai qui n'a pas été utilisé pour dériver le modèle.
la courbe Receiver Operating (ROC) et l'aire sous la courbe en particulier est une mesure simple et utile pour évaluer l'utilité d'un marqueur de diagnostic (s) [10]. Tout au long de ce document, ROC et l'ASC sont utilisés pour comparer entre les différentes méthodes et divers modèles pour la meilleure puissance de diagnostic de gastroparésie. La somme des faux diagnostics positifs et faux négatifs sur l'ensemble de l'échantillon a été utilisé pour comparer la puissance diagnostique entre LDA, DF et CART par jackknife (prendre une sortie) validation croisée.
Approche discriminante linéaire de Fisher (LDA)
Let w
ij
représente le i
e
valeur de marqueur de la j
e
sujet dans le groupe malade; et v
ik
être le i
e
valeur de marqueur de la k
e
sujet dans le groupe témoin; où i
= 1, ..., p; j
= 1, ..., m; et k
= 1, ..., n.
Supposons que X et Y sont des vecteurs de valeurs de position avec une distribution normale multivariée pour les groupes de malades et les témoins, respectivement, alors (1) Le vecteur de coefficients α
p × 1, pour la meilleure combinaison linéaire du vecteur marqueur combiné des groupes malades et de contrôle selon les critères ROC est: (2) l'ASC sous la courbe ROC est: (3), Φ désigne la norme cumulative . fonction de distribution normale
Spécificité (F a (c)) et de sensibilité (H a (c)) sont: (4) (5) Classement répartition approche basée libre (DF)
Selon la répartition approche basée libre de rang [19], l'ASC peut être calculée comme la statistique Mann-Whitney U [24]: (6) note, pour la distribution continue, Pr (I
= 1/2) = 0.
Où, w
ij
est le i
e valeur de marqueur pour le j
e sujet dans le groupe malade; v
ik
est le i
e valeur de marqueur pour le k
e sujet dans le groupe témoin; i, j, k, m
et n
tel que défini dans le paragraphe précédent; AUC

) est l'aire sous la courbe par la distribution libre d'accès avec le vecteur de coefficient optimal (α). Depuis ROC est invariant à monotone transformation croissante, le vecteur de coefficient α
dans les deux LDA et les approches DF peuvent être rééchelonnées comme (1, β 2 /β 1, β 3 /β 1, ... β i /β 1), où β i /β 1 représente le poids du i
e valeur de marqueur par rapport au marqueur 1 [19] Classification et régression Trees. (CART) modèle
Contrairement à LDA ou DF, la méthodologie CART identifie l'ensemble de prédicteurs de toutes les variables qui différencient mieux les classes dans le résultat d'intérêt dans un processus séquentiel. A chaque étape (noeud), l'algorithme CART identifie d'abord le meilleur prédicteur de toutes les variables de candidats, puis parcourt toutes les valeurs pour le meilleur prédicteur mais utilise un seul point de coupure pour diviser l'échantillon dans le noeud en deux sous-branches. Il cherche ensuite à travers toutes les variables prédictives et identifie le meilleur point du meilleur prédicteur au sein de chaque sous-branche de coupure et répète le processus jusqu'à ce que certains critères, comme une variance minimale ou une taille minimale d'un groupe, dans tous les noeuds terminaux sont remplis. À chaque noeud, CART cherche à classer l'échantillon en groupes de telle sorte que l'homogénéité maximale des noeuds enfant est atteinte. Quand un noeud terminal est atteint, le modèle donne la probabilité d'appartenance à une catégorie particulière pour tous les autres sujets qui tombent dans ce nœud. En pratique, la taille du noeud minimum est généralement fixée à 10% de l'échantillon d'apprentissage afin d'éviter potentiellement au-dessus de l'ajustement du modèle de telle sorte que l'arbre de décision finale est plus susceptible d'être utile pour la classification des populations ayant des caractéristiques similaires à celle de l'échantillon d'apprentissage, mais était non utilisé pour dériver le modèle de CART. Contrairement à l'approche LDA, CART peut être particulièrement utile lorsque les motifs de corrélation entre les variables prédictives ne sont pas cohérentes sur toute la gamme, car il ne faut pas pour la même variable soit optimale pour tous les nœuds de la branche de l'arbre tout entier [22].
estimation des paramètres
pour l'approche LDA, nous avons écrit un /programme IML SAS [25] pour le calcul de la moyenne (m), la variance (S) pour les groupes malades et de contrôle, et toutes les estimations des paramètres sont décrits dans la méthode section. Tout d'abord, le vecteur de coefficients α
, AUC pour la combinaison linéaire ainsi que des marqueurs individuels, on a obtenu des équations (2) et (3) à partir des données d'entraînement. Ensuite, le coefficient α
a été appliqué aux données d'essai correspondantes pour obtenir le score de combinaison linéaire. Trois valeurs de seuil correspondant à des niveaux de sensibilité à 0,7, 0,8 et 0,9 pour le score de combinaison linéaire ont été obtenus avec les données de la gastroparésie en utilisant l'équation (5). Chaque valeur de seuil a été utilisé sur les données laissées sur pour classer le cas dans le groupe soit malade ou non malade. L'état prédit a ensuite été recoupées avec la catégorie de maladie connue.
L'approche DF a commencé avec un point de départ arbitraire, puis la grille recherchée pour les coefficients qui maximisent la statistique Mann-Whitney U avec les données de formation dans les étapes suivantes.
1) un score de combinaison linéaire pour chaque observation a été obtenue en multipliant le vecteur marqueur X avec un vecteur de coefficient de départ, α
(1, α
).
2) l'ASC correspondant à le vecteur de coefficient α
est calculée avec l'équation (6).
3) Répéter les deux premières étapes pour chaque vecteur de coefficient possible et agréger la CUA et α
correspondant.
4) Sélectionnez le coefficient maximisé l'AUC et identifier la valeur du score de combinaison linéaire critique à 0,7, 0,8, et les niveaux de 0,9 sensibilité.
5) en appliquant le coefficient de l'étape 4 des données de test pour obtenir le meilleur score de combinaison linéaire.
6) utilisation chaque valeur critique de l'étape 4 dans les données de test pour prédire chaque cas dans les deux groupes malade ou non malade, puis traverser tabulate avec la catégorie de maladie connue.
pour le modèle de CART, nous avons utilisé le package TREE au sein de R [26] environnement pour chacune des quatre mesures horaires, et leur combinaison avec l'âge du patient et le sexe pour identifier le meilleur modèle. La validation croisée avec une taille minimum de 10 sujets pour chaque noeud terminal a été utilisé pour optimiser le modèle d'arbre de décision en utilisant toutes les observations [27]. AUC pour chaque arbre de décision optimisée a été calculée à comparer entre tous les modèles. Ensuite, une observation a été retiré de l'ensemble de l'échantillon, et les sujets restants utilisés pour construire l'arbre de décision, qui à son tour a été utilisé pour prédire l'état de la maladie de l'observation à l'écart. Performance pour chaque arbre de décision a été résumée avec le nombre total de prédictions erronées à travers l'ensemble de l'échantillon.
Données gastroparésie
Un total de 320 cartes de patients âgés de 16 ~ 89 (42,8 ± 14,3 (moyenne ± std)), 255 (79%) des femmes, avec GES mesures à 1 h, 2 h, 3 h et 4 h après un repas standard à l'aide d'une méthode normalisée (5) ont été rétrospectivement recueillies à l'Université du Kansas Medical Center (KUMC). Le protocole d'étude a été approuvé par le comité d'examen institutionnel (IRB) à KUMC. Au cours de la mesure des GES, la fraction de repas consommé et le temps nécessaire à la consommation a été enregistrée. Les sujets avec inhabituel pour cent repas consommés (par exemple < 20% du repas) /temps de consommation (par exemple > 30 minutes) ont été exclus. Tous les patients ont été soit désignés suspectés gastroparésie ou d'une enquête pour d'autres raisons à cause de symptômes auto rapportés tels que la nausée, la plénitude, la satiété précoce, des vomissements et des ballonnements. Sur la base de l'évaluation globale, en plus de GES mesures horaires, les médecins de l'étude diagnostic 197 (62%) des 320 patients atteints de gastroparésie comme la principale raison de symptômes cliniques mentionnés ci-dessus et de leurs visites à l'hôpital. Malgré les expériences médicales similaires, les maladies autres que la gastroparésie ont été considérés comme les diagnostics primaires pour les 123 patients restants. Aucune différence significative de l'âge moyen (p = 0,12, test t) et le sexe (p = 0,99, par χ essai 2) ont été trouvées entre les groupes avec et sans gastroparésie. Pour chaque patient, la vidange gastrique scintigraphie a été effectuée le matin après une nuit de jeûne avec prokinetics arrêté pendant au moins 3 jours. La méthode normalisée pour la vidange gastrique consiste en l'équivalent de deux œufs brouillés (substituts d'oeufs) marqués avec 99m Tc soufre colloïde, 2 morceaux de pain grillé avec de la gelée, et 4 ml d'eau avec une valeur calorique totale de 255 kcal. Anterior et images postérieures de l'estomac ont été prises immédiatement après avoir mangé, et puis toutes les heures pendant 4 heures [28]. Résultats de
Pendant la mesure répétée de la vidange gastrique, le pourcentage de rétentions de l'isotope dans l'estomac à 1 h, 2 h, 3 h et 4 h après le repas a diminué avec le temps et étaient fortement corrélés, en particulier pour les hommes et pour les patients atteints de la gastroparésie. Spearman coefficient de corrélation varie de 0,34 (p < 0,001) entre 1 h et 4 h pour les patients sans gastroparésie à 0,93 (p < 0,001) entre 3 h et 4 h pour les patients atteints de gastroparésie. Dans l'ensemble, la distribution en pour cent de rétention est écarté de la normale, avec les deux premières valeurs horaires biaiser vers l'extrémité inférieure, et les deuxièmes deux heures biaiser vers l'extrémité supérieure (figure 1). Figure 1 Pourcentage de rétention gastrique à 1 h, 2 h, 3 h et 4 h après le repas pour le cas (vert) par rapport au témoin (gris). 1-H-C, 2-H-C, 3 h-c, 4-h-c représente un pour cent de la vidange gastrique (GE) à 1 h, 2 h, 3 h et 4 h après le repas pour les patients diagnostiqués avec la gastroparésie; Moustaches représente 70% Gamme de interquartile
. Pouvoirs de diagnostic par LDA et l'approche DF
mesures horaires à 3 h et 4 h ont déjà été signalés comme ayant le meilleur utilitaire de diagnostic, nous avons comparé leur meilleure combinaison linéaire à la fois par LDA ( la figure 2) et des approches DF (Tableau 1). Tout d'abord, nous avons estimé AUC pour les deux mesures ainsi que le coefficient optimal pour leur meilleure combinaison linéaire et les valeurs de seuil pour le score de combinaison linéaire à 0,7, 0,8, et 0,9 niveaux de sensibilité à la fois par LDA et DF approches pour tous, mais 1 sur 320 sujets. Le coefficient optimal, ainsi que les trois valeurs de seuil est ensuite appliqué sur le sujet à l'écart. En comparant les valeurs de seuil avec le score de combinaison linéaire calculée, le statut gastroparetic prédit pour le sujet à l'écart a été enregistré. Les taux de faux positifs et de faux négatifs ont été obtenus en répétant le processus de jackknife pour tous les 320 sujets. Ensuite, une transformation de puissance Box-Cox a été appliquée et la même analyse a été répétée pour les données transformées. Figure 2 Fonctionnement Caractéristique (ROC) Courbe de récepteur pour la rétention pour cent horaire à 2 h, 3 h, 4 h, et de leur meilleure combinaison linéaire. Aire sous la courbe (AUC) a augmenté de 2 h à 4 h et maximisé avec la meilleure combinaison linéaire des trois mesures horaires.
Tableau 1 Estimations des paramètres (aire sous la courbe (AUC) et le coefficient pour la meilleure combinaison linéaire ) avec l'analyse discriminante linéaire (de LDA) et la distribution de Fisher libre (DF) approches

4 h
3 h
combinaison linéaire combinaison DF
linéaire LDA

Raw

Tran

Raw

Tran

α

Raw

α

Tran

α

Raw

α

Tran

Mean
0.830
0.879
0.824
0.827
0.02
0.869
0.02
0.869
0.681
0.834
0.055
0.881
STD
0.002
0.001
0.002
0.002
0.00
0.001
0.00
0.001
0.032
0.002
0.002
0.001
Median
0.830
0.879
0.824
0.827
0.02
0.869
0.02
0.869
0.679
0.833
0.055
0.880
Range
0.013
0.009
0.011
0.009
0.00
0.008
0.00
0.008
0.284
0.012
0.017
0.009
Note: Raw signifie AUC pour la mesure à l'échelle d'origine;
Tran représente l'ASC pour la mesure à l'échelle transformée;
α est le coefficient pour la meilleure combinaison linéaire pour la mesure à 3 h après le repas
Le meilleur linéaire. une combinaison des deux mesures horaires ont augmenté la puissance de diagnostic de ses composants individuels par les deux approches (tableau 2), mais le gain a été limitée, de 3,9% pour le DF, et 0,4% pour l'approche LDA. Comme prévu, Box-Cox puissance transformation sur les marqueurs individuels amélioré la puissance de diagnostic par la meilleure combinaison linéaire avec l'approche LDA de 4,7% à celle de la measures.Table brute 2 classifications Faux (%) avec jackknife validation croisée par le discriminante linéaire de Fisher Analyse (LDA) et la distribution gratuite (DF) approches
Critères
3- h DF
4 h combinaison DF
linéaire combinaison DF
linéaire LDA
0,7
24 (19,5%)
59 ( 30,0%)
16 (13,0%)
59 (30,0%)
15 (12,2%)
58 (29,4%)
15 (12,2%)
64 (32,3% )
0.8
37 (30,1%)
39 (19,8%)
21 (17,1%)
40 (20,3%)
21 (17,1%)
40 ( 20,3%)
20 (16,3%)
46 (23,4%)
0,9
60 (48,8%)
21 (10,7%)
27 (21,9%)
23 (11,7%)
28 (22,8%)
20 (10,2%)
27 (22,0%)
22 (11,2%)
Remarque: le modèle prédit l'état de la maladie (1 pour oui, 0 pour non);
y
: état diagnostiqué de la maladie (1 pour oui, 0 pour non)
Avec les données brutes, les différences de somme des taux négatifs faux positifs et faux pour le meilleur. combinaisons linéaires ont été de 0,2%, 1,6% et -6,5% entre le DF et LDA approches aux 0,7, 0,8, et 0,9 niveaux de sensibilité. Alors que les taux de faux négatifs de l'approche LDA ont montré un grand écart par rapport à celui correspondant aux niveaux préréglés de seuil (≤3.0%), les personnes par l'approche DF sont relativement proches (≤ ± 0,2%).
Transformation de données amélioré la puissance de diagnostic des meilleures combinaisons linéaires à la fois pour la LDA et DF approches en diminuant la somme des taux positifs faux négatifs et faux. Les réductions sont de 2,2%, 2,8%, 13,8% et -0,9%, -1,1%, 20,1% pour les approches DF et LDA, respectivement. Fait intéressant, la plus grande amélioration de la puissance de diagnostic est au niveau de la sensibilité plus élevée pour les deux approches.
Pouvoirs de diagnostic avec sept modèles d'arbre de décision CART approche, y compris le modèle complet (4 mesures horaires ainsi que l'âge du patient), les combinaisons de 2 h et 4 h, 3 h et 4 h, avec chacune des mesures horaires, ont été optimisés grâce à l'élagage avec la taille minimum pour le noeud final de 10 sujets [26]. Pour tous les modèles un seul point de temps, la rétention pour cent à 4 h a la plus grande de l'AUC 0,865, suivie de 3 h, 2 h et 1 h, respectivement (tableau 3). Le taux de faux diagnostic par le modèle d'arbre de décision avec 4 h est de 14,4% (28 sur 123 pour les patients sans gastroparésie, et 18 sur 197 pour ceux avec gastroparésie), moins de la moitié de ceux qui seraient diagnostiqués à tort par la 1- h et 2 h-points et 37% ((73-46) /73) inférieure à celle -at 3 h. Y compris 2 h ou 3 h avec 4 h avec l'arbre de décision n'a pas augmenté le nombre de diagnostics corrects pendant 4 h en utilisant seulement comme indiqué par la validation croisée flambage. Ceux-ci diffèrent des résultats obtenus à partir de LDA et DF approches, dans lequel la combinaison linéaire de 3 h et 4 h a montré une légère amélioration par rapport à l'aide de 4 h seulement. Cependant, le modèle d'arbre de décision soit 4 h seul ou sa combinaison avec 2 h ou 3 h n'a pas souffert dans l'utilitaire de diagnostic par rapport à ses modèles de contrepartie identifiés soit avec LDA ou approche DF, quelle que soit la transformation des données. Le modèle de la série CART en utilisant les quatre GES mesures horaires ainsi que l'âge du patient était très intéressant. Pour les critères de rétention gastrique > 10% à 4 h et < 53% à 2 h, patients > vieux 47,5 ans étaient presque 2 fois moins susceptibles d'avoir la gastroparésie (probabilité = 0,44) que ceux avec l'âge < 47.5 (probabilité = 0,85) .Table 3 fausses classifications (%) avec jackknife validation croisée par Classification optimisée et arbre de régression (CART) modèles
type de Misdiagnosis

1-h
2 h
3 h
4 h

2 h + 4 h
3 h + 4 h
4 h + 3 h + 2 h + 1 h + Âge

76 (61,8%)
28 (22,8%)
29 (23,6%)
28 (22,8%)
28 (22,8%)
28 (22,8%)
26 (21,1%)
24 (12,2%)
69 (35,0%)
44 (22,3%)
18 (9,1%)
18 (9,1%)
18 (9,1%)
18 (9,1%) total Misdiagnosis
100 (31,3%)
97 (30,3%)
73 (22,8%)
46 (14.4 %)
46 (14,4%)
46 (14,4%)
44 (13,8%)
AUC Pour le modèle optimisé
0,724
0,753
0,825
0,867
0,865
0,858
0,881
note:: modèle prédit l'état de la maladie (1 pour oui, 0 pour non);
y
: état de la maladie diagnostiquée (1 pour oui, 0 pour non Rapport
combinaisons linéaires de marqueurs diagnostiques obtenus par LDA ou approche DF) de. conduit généralement à des puissances plus élevées (une discrimination plus grande AUC) que ses composants individuels. Une étude de simulation (résultats non montrent ici) a indiqué que plus la corrélation entre les marqueurs individuels, plus l'augmentation de l'ASC par leur combinaison linéaire. Le gain potentiel de puissance diagnostique, cependant, diminue lorsque la corrélation entre les marqueurs individuels augmenter jusqu'à 0,7 et au-dessus. L'efficacité de l'aide d'une combinaison linéaire diminue avec l'augmentation de l'amplitude de la disproportion dans les matrices de covariance entre les groupes malades et de contrôle.
Petite taille des échantillons conduisent à une grande variation des coefficients optimaux pour la meilleure combinaison linéaire et l'AUC correspondant, en particulier pour la approche LDA. Comme la taille de l'échantillon augmente, les coefficients optimaux et AUC par LDA ou méthodes DF peuvent ou peuvent ne pas approcher les uns des autres en fonction de la répartition des marqueurs individuels.
Valeurs de marqueurs
normale Lorsque les valeurs de marqueur sont normale multivariée, les estimations de la approche LDA sont très proches de celle de la méthode DF en termes d'AUC, coefficients optimaux, et la puissance de diagnostic comme indiqué par simulation. Avec une distribution normale et la taille d'échantillon adéquate, les deux premiers moments de capturer l'emplacement et l'échelle du paramètre de marqueur avec une petite variation. Dans de tels cas, l'approche LDA a l'avantage d'économiser du temps de calcul (plus de 100 fois moins) sans souffrir de la puissance prédictive que l'approche DF. Néanmoins, LDA ne peut pas surpasser DF aussi longtemps que la grille de recherche pour coefficient optimal avec DF contient l'estimation ponctuelle par LDA. En d'autres termes, la limitation de DF est dans le calcul, au lieu de la méthodologie.
Valeurs de marqueur pas normal Lorsque les valeurs des marqueurs dévient de distribution normale, l'approche DF conduit toujours à l'AUC supérieur pour la meilleure combinaison linéaire si la recherche grille pour coefficients optimaux est assez fine. La performance de déclassement à l'approche LDA est un résultat direct de l'utilisation des moyens qui est sollicitée en raison d'une anomalie. Distribution exponentielle, par exemple, a tendance à avoir une longue queue avec un haut degré d'asymétrie, conduisant à une moyenne avec un biais positif. En conséquence, les variances pour les marqueurs sont gonflés et l'AUC ont tendance à être plus petite. Plus important encore, la meilleure combinaison linéaire obtenue avec l'approche de LDA a tendance à surestimer le taux de faux négatifs et de sous-estimer le taux de faux positifs au niveau de la sensibilité plus faible (tableau 2), et faire exactement le contraire au niveau de la sensibilité plus élevée. Au contraire, la meilleure combinaison linéaire par l'approche DF est moins affectée par les valeurs extrêmes et tend à avoir le pouvoir de diagnostic plus élevé tout en maintenant les niveaux de sensibilité prédéfinis. Ceci est important parce que, dans la pratique, un taux de faux négatifs fixe représente une limite critique de la tolérance en médecine diagnostique. Au-delà de cette limite, l'enjeu du rapport de perte-bénéfice augmenterait, ou, au moins, la décision de diagnostic est moins rentable.
L'effet de transformation de données
transformation de données efficace améliore l'ajustement normal et l'estimation ainsi paramètre par approche LDA, mais si cette amélioration se tenir dans de nouvelles données qui ne sont pas inclus pour l'estimation des paramètres reste incertaine. La validation croisée avec les données de gastroparésie a indiqué que la transformation de puissance a augmenté l'ASC et stabilisé les estimations des paramètres dans les ensembles de formation, et que ces gains se traduirait par la puissance de diagnostic plus élevé dans les ensembles de test (tableau 2). transformation de données réduit l'écart dans la puissance de diagnostic entre les meilleures combinaisons linéaires par LDA et DF approche avec les données cliniques. Fait intéressant, l'approche DF a montré une amélioration conforme à la transformation à tous les niveaux de sensibilité à 0,7, 0,8, et 0,9. La tendance à l'approche LDA est pas aussi claire. Une raison pourrait être les rétentions gastriques pour cent mesurée à 3 h et 4 h sont tellement asymétrique que la transformation de puissance ne suffit pas de mettre les mesures sur la distribution presque normale.
Optimiser la puissance de diagnostic par des mesures de GES avec le modèle CART
Contrairement à la recherche précédente avec des volontaires normaux, notre population étudiée était composée d'un groupe mixte de sujets soit mentionné avec une suspicion gastroparésie ou d'une enquête pour d'autres raisons.

Other Languages