Espagnol et Anglais
Dans l'expérience de [Mehler, Dommergues, Frauenfelder SeguiMehler 1981], les sujets détectaient plus rapidement un fragment (p.ex. /ba/ ou /bal/) quand celui-ci correspondait précisément à la structure syllabique du stimulus (p.ex. /ba-lance/ ou /bal-con/). Selon les auteurs, cet effet de "congruence syllabique'' était l'indice d'une segmentation et d'une catégorisation en syllabes du signal de parole. Bien que l'expérience n'avait été réalisée qu'avec des sujets français, cette segmentation syllabique était censée être universelle. La syllabe était proposée comme l'"unité perceptive primaire'', qui servait à l'acquisition des mots par l'enfant (chacun étant une suite de syllabes), et également à l'accès au lexique mental chez l'adulte [MehlerMehler1981,Mehler, Dupoux SeguiMehler 1990,SeguiSegui1984].
Cependant, Cutler, Mehler, Norris et Segui (1983; 1986), qui tentaient de reproduire l'expérience de [Mehler, Dommergues, Frauenfelder SeguiMehler 1981] en anglais, ont trouvé que les locuteurs de cette langue n'étaient pas influencés par la structure syllabique des stimuli. Ainsi, ils détectaient /bal/ et /ba/ à la même vitesse dans /balance/ et dans /balcony/. Mieux, cette étude démontre que le contraste entre français et anglais ne réside pas dans une différence entre les stimuli anglais et français, mais dépend de la langue maternelle du locuteur : en échangeant la langue des sujets et celle des stimuli, c'est à dire en faisant écouter des stimuli anglais aux sujets français et vice-versa, il est apparu que les locuteurs français syllabifiaient les stimuli anglais et que les locuteurs anglais ne syllabifiaient pas les stimuli français. Pour rendre compte de ces résultats, Cutler et al. (1986) ont proposé que les sujets possèdent des stratégies de segmentation dépendantes de la langue maternelle. Pourtant, les motivations principales pour postuler des unités de segmentation prélexicale étaient les problèmes de l'acquisition du lexique par l'enfant, et de la normalisation perceptive [Mehler, Dupoux SeguiMehler 1990]. Il était donc paradoxal de proposer que l'unité de segmentation dépendait de la langue. C'est pourquoi Cutler et al. (1986) ont proposé que la stratégie de segmentation n'était pas absolument arbitraire : l'enfant disposerait initialement d'un répertoire fini de stratégies possibles et "sélectionnerait'' celle qui est la mieux adaptée à la langue maternelle. Logiquement, Cutler et al. ont recherché quelle(s) caractéristique(s) de la langue pouvaient favoriser ou non l'emploi d'une stratégie de segmentation syllabique.
Dans leur article de 1986, ils notent que la clarté des frontières syllabiques diffèrent entre les langues. Si la syllabification du français est intuitivement claire (pour les Français), il n'en va pas de même pour l'anglais : les sujets anglais ne savent pas bien où placer la frontière syllabique dans /balance/. En fait, si on leur demande quelles sont, respectivement, la première et la seconde syllabe de ce mot, beaucoup répondront /bal/ et... /lance/. Souvent, ils hésitent à attribuer le /l/ aux deux syllabes et préfèrent ne pas répondre. Les analyses linguistiques, reflétant les intuitions contradictoires des sujets, décrivent le /l/ de "balance'' comme ambisyllabique. Les principes de base de la syllabification (Principe de l'Attaque Maximale et Règles de sonorité) s'accordent à segmenter une suite CVCV entre la voyelle et la consonne (i.e. CV-CV). Toutefois, en anglais, les consonnes situées entre deux syllabes dont la première est accentuée et la seconde est inaccentuée, se conduisent phonétiquement comme si elles appartenaient au coda de la première syllabe plutôt qu'à l'attaque de la seconde. Ainsi, "balance'' serait syllabifié, phonétiquement : /bal-ance/, et phonologiquement : /ba-lance/. Notons que les linguistes diffèrent dans leur traitement de l'ambisyllabicité : pour certains, il faut décrire la consonne ambisyllabique comme appartenant simultanément aux deux syllabes [KahnKahn1976], alors que pour d'autres, elle appartient à la seconde syllabe, à un certain niveau de représentation, puis à la première syllabe, dans des niveaux plus proches des représentations superficielles [SelkirkSelkirk1982].
Selon la théorie de Cutler et al. (1986), le fait que les frontières syllabiques soient ambiguës en anglais, décourage l'acquisition d'une stratégie de segmentation syllabique chez les enfants qui apprennent cette langue. Par contre, ils prédisent que les sujets dont la langue maternelle présente des frontières syllabiques claires doivent appliquer la stratégie de segmentation syllabique. Ceci est le cas de l'espagnol. Pourtant, quand [Sebastian-Gallés, Dupoux, Segui MehlerSebastian-Gallés 1992] ont effectué une expérience de détection de fragments avec des sujets espagnols, ils n'ont pas, à leur grande surprise, observé l'interaction caractéristique de l'"effet syllabique''. En cherchant des raisons à ce résultat, ils ont invoqué une explication déjà avancée par Dupoux dans sa thèse : dans les tâches de détection, quand les sujets répondent très rapidement, ils peuvent exploiter un code sub-syllabique " transitoire'' (hypothétiquement des demi-syllabes pour Dupoux, 1989). Selon [Sebastian-Gallés, Dupoux, Segui MehlerSebastian-Gallés 1992], l'identification des voyelles pourrait être facilitée chez les Espagnols par le fait qu'elles sont en plus petit nombre qu'en français (cinq contre quinze), et, par hypothèse, acoustiquement plus "claires''. Ils ont nommé cette propriété (hypothétique) "transparence acoustique des voyelles''. En ralentissant les réponses des sujets dans le but de décourager l'emploi d'une stratégie "acoustique'', les auteurs ont prédit qu'ils observeraient à nouveau des réponses " syllabiques'', et ce fût effectivement le cas. Nonobstant la transparence acoustique, les Espagnols, qui possèdent une langue avec des frontières syllabiques claires, appliquent donc une stratégie de segmentation syllabique, en accord avec la théorie de Cutler et al. (1986).
D'autres résultats remettent toutefois en cause cette théorie. Tout d'abord l'interaction syllabique a été observée en hollandais, une langue où l'ambisyllabicité est très répandue [Zwitserlood, Schriefers, Lahiri DonselaarZwitserlood 1993]. Puis, [Bradley, Sánchez-Casas García-AlbeaBradley 1993] ont trouvé que les Espagnols n'appliquaient pas la segmentation syllabique quand ils écoutaient des stimuli anglais (contrairement aux Français dans l'étude de Cutler et al.; 1986). Pire, selon cette dernière étude, des sujets espagnols ayant appris l'anglais assez tardivement ne syllabifieraient plus même l'espagnol ! Pour être juste, il faut noter que la théorie selon laquelle les sujets utilisent une stratégie de segmentation dépendante de leur langue maternelle (fondée sur l'unité rythmique de celle-ci dans la version récente de la théorie ; cf Cutler 1993) a aussi remporté des succès : elle a correctement prédit le comportement de sujets Français, Anglais et Japonais, écoutant des stimuli japonais [Otake, Hatano, Cutler MehlerOtake 1993].
Finalement, les résultats obtenus avec la détection de fragments offrent un tableau complexe (cf [KearnsKearns1994] pour une revue). Les résultats obtenus en espagnol [Sebastian-Gallés, Dupoux, Segui MehlerSebastian-Gallés 1992,Bradley, Sánchez-Casas García-AlbeaBradley 1993] montrent, me semble-t-il, que s'il est juste de considérer la présence de l'interaction comme prouvant que les sujets utilisent la structure syllabique, il ne faut pas déduire de l'absence d'interaction, que les sujets ne " récupèrent'' pas la structure syllabique des stimuli. De nombreuses raisons méthodologiques peuvent conduire à l'absence d'effet significatif, même s'il est vrai que les expériences avec les sujets anglais de Cutler et al. (1986) étaient aussi similaires que possible avec celles menées avec les Français, et si l'absence d'interaction syllabique a été reproduite par Bradley et al. (1993) et Otake et al. (1993). De plus, étant donné que l'effet syllabique peut disparaître même chez des sujets français quand leurs temps de réaction sont rapides (Cf Dupoux, en préparation), on doit prendre en considération la possibilité que les sujets anglais, comme les Français [Mehler, Dommergues, Frauenfelder SeguiMehler 1981], les Espagnols [Sebastian-Gallés, Dupoux, Segui MehlerSebastian-Gallés 1992,Bradley, Sánchez-Casas García-AlbeaBradley 1993], les Portugais [Morais, Content, Cary, Mehler SeguiMorais 1989], et surtout les Hollandais dont la langue est plus proche de l'anglais [Zwitserlood, Schriefers, Lahiri DonselaarZwitserlood 1993], se forment une représentation syllabique des stimuli, mais que, pour des raisons qu'il faudra expliquer, ne sont pas influencées par celle-ci dans la tâche de détection de fragment.
Quand Cutler, Mehler, Norris et Segui (1986) affirment que "les Anglais ne sont pas influencés par la structure syllabique des stimuli'', ils devraient ajouter "dans les premières étapes de la perception''. En effet, d'une part, de nombreux arguments linguistiques existent, qui justifient le rôle de la syllabe dans les processus phonologiques en anglais comme dans les autres langues, et d'autre part, des mesures psycholinguistiques révèlent l'influence de la structure syllabique sur le comportement des sujets anglais. Ces données psycholinguistiques proviennent essentiellement des travaux de R. Treiman [TreimanTreiman1983,TreimanTreiman1986,Treiman DanisTreiman Danis19881,Treiman DanisTreiman Danis19882,Treiman ZukowskiTreiman Zukowski1990,Treiman, Straub LaveryTreiman 1994,Fowler, Treiman GrossFowler 1993] où les sujets doivent effectuer des tâches métalinguistiques de manipulation (duplication, transpositions...) de phonèmes. Typiquement, les sujets apprennent plus facilement les opérations qui respectent la structure syllabique plutôt que celles qui la violent. Cutler et al. ne prennent pas en compte de tels résultats, sans doute parce qu'ils considèrent que ces tâches sont tardives, et ne reflètent pas les premières étapes du traitement de la parole (Treiman elle-même admet que les sujets sont influencés, par exemple, par l'orthographe).
Quoiqu'il en soit, une théorie ambitieuse, selon laquelle les enfants acquièrent une procédure de segmentation de la parole qui dépend de la langue maternelle, doit être fondée sur d'autres paradigmes que celui de la détection de fragments. C'est pourquoi, nous avons décidé de réaliser des expériences de détection de phonème attentionelle, biaisée syllabiquement, avec des sujets de langues maternelles espagnol et anglais.
Rappelons que les locuteurs espagnols sont supposés être influencés par la structure syllabique des stimuli ; cette prédiction se fonde sur le fait que les frontières syllabiques sont claires en espagnol. Pourtant, avec la tâche de détection de segment, l'interaction caractéristique de la segmentation syllabique n'a été observée qu'à des temps de réaction relativement lents (cf supra). C'est pourquoi nous avons voulu utiliser le paradigme de détection attentionnelle dans cette langue.
N. Sebastian-Gallés et T. Felguera, de l'université de Barcelone, ont conduit, avec notre collaboration, trois expériences de détection de phonème attentionnelle avec biais syllabique. La première était semblable en tous points à l'expérience 3.1 : les mots français étaient simplement remplacés par des mots espagnols (cf annexe p.). Les sujets étaient des étudiants de l'université de Barcelone, tous de langue maternelle espagnole (certains étaient bilingues espagnol-catalan). Les résultats sont présentés sur la figure 4.1 :
Dans une anova sur les temps de réaction, où étaient déclarés les facteurs : Syllabe (cible en coda ou en attaque), Position (3ème ou 4ème phonème) et Induction (groupe recevant une liste biaisée soit vers le coda, soit vers l'attaque), l'interaction Syllabe Induction est hautement significative (F1(1,48)=25.5; F2(1,28)=25.9) ; il y a également un effet principal dû au facteur Syllabe, les sujets étant plus rapides pour détecter les cibles en attaque plutôt que les cibles en coda (F1(1,48)=16.0;F2(1,28)=4.2).
Hormis l'effet principal de Syllabe, ces résultats sont similaires à ceux de l'expérience française : les Espagnols détectent plus rapidement un phonème cible placé dans une position syllabique attendue que dans une position non-attendue. Comme les temps de réaction étaient assez lents, une seconde expérience a été réalisée dans le but d'accélérer les réponses des sujets. Pour cela, les instructions insistaient sur l'importance de la vitesse de réponse et la tâche de décision (oui/non) était remplacée par une tâche de détection (go/no-go). Les résultats de cette seconde expérience sont dessinés sur la figure 4.2.
Ces résultats sont qualitativement
identiques à ceux de l'expérience précédente. L'analyse de
variance conduit exactement aux mêmes conclusions que la première
expérience (Interaction Syllabe Induction :
[3]
F1(1,34)=14.3, F2(1,28)=8.9 ; Syllabe : F1(1,34)=12.5,
F2(1,28)=4.2). Bien que les temps de réaction soient assez
rapides, on ne peut être assuré de leur statut prélexical. Par
conséquent, une troisième expérience a été réalisée où, cette
fois, les stimuli étaient des non-mots (cf annexe
p.) pour conforter l'hypothèse que ces
résultats n'ont pas une origine post-lexicale. La figure
4.3 montrent les temps de réaction obtenus.
Statistiquement, seule l'interaction Syllabe Induction est significative (F1(1,24)=22.8; F2(1,28)=21.7), ce qui révèle encore l'efficacité de l'induction attentionnelle syllabique. Il n'y a, par contre, plus d'effet de position syllabique ce qui suggère que celui observé dans les deux expériences précédentes pouvait provenir de caractéristiques accidentelles du matériel. Une autre possibilité est que, quand les stimuli étaient des mots, les réponses des sujets étaient influencées par une rétroaction lexicale, et que cette influence soit plus importante pour les phonèmes de la seconde syllabe que pour les phonèmes de la première syllabe. Si cette interprétation était correcte, cela pourrait être considéré comme une belle démonstration du modèle d'accés au lexique par la première syllabe [Cole JakimikCole Jakimik1980,DupouxDupoux1989] : les détections de phonèmes placés dans la première syllabe seraient prélexicales, et celles des phonèmes placés dans les syllabes suivantes seraient postlexicales. Cela demeure trés spéculatif étant donné que le matériel n'était pas contrôlé pour d'autres facteurs (fréquence, acoustique...etc) et rappelons qu'en français, nous n'avons pas observé de différence entre les codas et les attaques.
En conclusion, les résultats des trois expériences sont clairs : les sujets espagnols peuvent focaliser leur attention sur une position syllabique précise. Cela conforte l'hypothèse selon laquelle la syllabe joue un rôle dans la perception de la parole dans cette langue. De plus, la troisième expérience rend moins plausible l'hypothèse que la structure syllabique ne puisse être récupérée qu'après l'identification du mot.
[Sebastian-Gallés, Dupoux, Segui MehlerSebastian-Gallés 1992] avaient invoqué la "transparence acoustique '' des voyelles espagnoles pour expliquer l'absence d'interaction syllabique dans la tâche de détection de segment quand les réponses étaient rapides. Dans la tâche de détection attentionnelle, il n'y a pas d'artefact possible du à la transparence acoustique, et l'on peut penser que cela explique que les résultats soient "plus stables'' que ceux obtenus avec la détection de segment. Toutefois une autre interprétation peut être invoquée : ce serait parce que le sujet est plus avancé dans le stimulus, au moment où il effectue la détection de phonème généralisé (par rapport à la détection de fragment initial), que l'information syllabique est plus claire et peut influencer la réponse. Quoiqu'il en soit, il est possible que la tâche de détection attentionnelle fournisse au sujet plus de chances d'utiliser une représentation syllabique. Le cas le plus crucial est bien sûr celui de l'anglais, pour lequel les sujets n'ont jamais semblé sensibles à la structure syllabique dans la tâche de détection de segment.
L'expérience suivante est une adaptation à l'anglais de la détection de phonème biaisée syllabiquement (exp. 3.1). La sélection du matériel pour réaliser une telle expérience est très délicate. Si l'on sélectionne aléatoirement des mots CV-CC et des mots CVC-C dans un dictionnaire anglais (en se fondant sur le principe de l'attaque maximale pour justifier la syllabification), il apparaît qu'il y a une forte corrélation entre la structure syllabique et le caractère tendu ou lâche de la première voyelle : la plupart des voyelles sont tendues dans la structure CV-CC et lâches dans la structure CVC-C (au point qu'il n'y a tout simplement pas de mots anglais CVC-C avec V tendue où le coda serait une occlusive). Pour éviter que les sujets ne s'habituent à la nature de la première voyelle plutôt qu'à la structure syllabique, nous avons limité la sélection aux mots avec première voyelle lâche. Pour éviter également que le pattern accentuel ne distingue les deux catégories "coda'' et "attaque'', nous avons imposé à tous les stimuli d'avoir l'accent principal en première syllabe, ainsi qu'une seconde syllabe non accentuée. Ces restrictions sélectionnent finalement un matériel semblable à celui utilisé en détection de fragment par Cutler et al. (1986) (paires de type " balance / balcony'').
Les stimuli étaient tous des mots américains (sélectionnés dans le Webster's Pocket). On a enregistré le phonologue américain M. Hammond qui avait pour consigne de les lire avec un accent "standard''. Tous ces mots étaient bi- ou tri-syllabiques, avec l'accent primaire sur la première syllabe et la seconde syllabe non-accentuée. La voyelle de la première syllabe était systématiquement une voyelle lâche. La syllabification était dictée par le principe de l'attaque maximale. Les mots tests et les inducteurs de type "coda'' avaient une structure CVC-CV ; les mots tests de type "attaque '' avaient une structure CV-CCV, les mots inducteurs de type " attaque'' avaient une structure CV-CV (car il n'y avait pas suffisamment de mots de structure CV-CCV à la fois pour les mots tests et pour les inducteurs). Comme il n'y a pas suffisamment de mots de structure adéquate commençant par un groupe CC, nous n'avons pas distingué les positions 3ème et 4ème phonème comme nous l'avions fait dans les expériences françaises et espagnoles. Pour éliminer la possibilité que les sujets s'habituent à détecter certains types d'allophones, les phonèmes cibles étaient différents dans les inducteurs (liquides et nasales) et dans les mots tests (occlusives, cf tab.4.1). Toutefois, pour tester si cette manipulation risquait de faire disparaître l'induction, nous avons inclu dans les deux listes 10 items tests "bis '' ayant exactement les mêmes caractéristiques que les inducteurs (cf tab.4.2).
Aprés avoir éliminé les erreurs (3.4 % des données) et les temps de réaction situés en dehors de l'intervalle 100..1500 (0.5 % des données), on a obtenu les temps de réaction moyens et les taux d'erreurs sur les mots tests présentés dans la table 4.3, en fonction du groupe d'induction et de la position syllabique de la cible.
L'inspection de la table 4.3 révèle que l'interaction sur les temps de réaction va dans le sens opposée à celui prédit par l'induction syllabique : le groupe coda est plus rapide en position "attaque'' qu'en position "coda ''. Cependant, les anovas sur ces données avec les deux facteurs déclarés Syllabe (position de la cible) et Groupe (induction coda ou attaque) ne révèlent aucun effet statistiquement significatif si ce n'est celui de Groupe dans l'analyse par items, ce qui est sans grande signification. L'interaction sur les erreurs va dans le sens prédit, mais n'est pas significative. Finalement, pour examiner si c'est le fait d'avoir des phonèmes différents dans les mots tests et dans les mots inducteurs qui est responsable de l'absence d'induction, nous avons conduit des anovas identiques sur les 10 items tests bis, qui n'ont revélé, là encore, aucun effet significatif.
Analyses par sujets : PLAN S21<G2>*S2 G = Groupe d'induction S = Position de la cible (S1=Coda et S2=Attaque) Temps de r\'eaction S F(1,40)= 0.73 MSE=2127.15 p=0.3980 G F(1,40)= 0.54 MSE=35196.7 p=0.4667 G.S F(1,40)= 1.47 MSE=2127.15 p=0.2325 S/G1 F(1,20)= 1.72 MSE=2630.15 p=0.2046 S/G2 F(1,20)= 0.08 MSE=1624.14 p=0.2198 Erreurs S F(1,40)= 0.00 MSE=0.3143 p=0.0000 G F(1,40)= 0.07 MSE=0.6476 p=0.2073 G.S F(1,40)= 1.36 MSE=0.3143 p=0.2504 S/G1 F(1,20)= 0.52 MSE=0.4143 p=0.4792 S/G2 F(1,20)= 1.00 MSE=0.2143 p=0.3293 Analyse par items : PLAN S13<S2>*G2 Temps de r\'eaction S F(1,24)= 0.14 MSE=6685.7 p=0.2884 G F(1,24)= 6.59 MSE=1795.2 p=0.0169 G.S F(1,24)= 1.08 MSE=1795.2 p=0.3091 S/G1 F(1,24)= 0.60 MSE=4694.85 p=0.4461 S/G2 F(1,24)= 0.02 MSE=3786.05 p=0.1113 Erreurs S F(1,24)= 0.00 MSE=1.0096 p=0.0000 G F(1,24)= 0.22 MSE=0.3429 p=0.3567 G.S F(1,24)= 2.02 MSE=0.3429 p=0.1681 S/G1 F(1,24)= 0.50 MSE=0.6987 p=0.4863 S/G2 F(1,24)= 0.53 MSE=0.6538 p=0.4737
L'interaction caractéristique de la focalisation sur une position syllabique n'apparait pas chez les locuteurs anglais. Deux possibilités s'offrent pour expliquer ce résultat : (a) les Anglais, conformément à la proposition de Cutler et al. (1986), ne sont pas influencés par la structure syllabique des stimuli, ou bien (b) la structure syllabique de nos stimuli n'est pas celle qu'on pensait.
Notre matériel était similaire à celui de Cutler et al. (1986) qui n'avaient pas observé d'effet de congruence syllabique dans la tâche de détection de fragments. Comme on l'a évoqué plus haut, la syllabification des stimuli, dont la première syllabe est accentuée et contient une voyelle lâche, est ambiguë. En réalisant cette expérience, notre pari était que le principe de l'attaque maximale l'emporterait, au niveau de représentation utilisé par les sujets pour effectuer la tâche, sur les autres facteurs influençant la syllabification, et nous avons considéré que le /l/ de /balance/ appartenait à l'attaque de la seconde syllabe. Si ce /l/ appartient en fait à la première syllabe (ou aux deux simultanément) alors il n'est pas surprenant que l'induction n'ait pas eu lieu car les deux groupes, s'ils focalisaient leur attention sur une position syllabique, la focalisaient sur la position coda de la première syllabe. A l'appui de cette interprétation, on peut citer les intuitions de syllabification des sujets anglais de [Treiman DanisTreiman Danis19882] : quand la première syllabe était accentuée et contenait une voyelle courte (=lâche), les sujets préféraient le découpage VC-V dans 66 % des cas.
Tout cela demeure spéculatif. Toutefois, une pierre de touche de l'argumentation de Cutler et al. (1986) est que les Français, eux, sont sensibles à la structure syllabique, non seulement des stimuli français mais aussi des stimuli anglais. Nous avons donc décidé de suivre leur exemple et de faire passer l'expérience de détection de phonème attentionnelle américaine à des sujets français.
Les erreurs (7.3 % des données) ont été remplacées, ainsi que les temps en dehors de l'intervalle 100..1500 msec (2.1 % des données). La table 4.4 fournit les moyennes.
Les anovas ont été conduites avec les facteurs Groupe d'induction (intra-sujet) et Syllabe (position de la cible : coda ou attaque ; intra-sujet). L'effet principal dû à Syllabe est significatif ("attaque'' 35 msec plus rapide que "coda''), mais uniquement dans l'analyse par sujets. Cet effet est significatif seulement pour le groupe attaque, mais il n'y ait pas d'interaction significative Groupe Syllabe. Il y a également un effet de Groupe significatif dans les analyses par items apparemment dû à une compensation ("trade-off'') entre erreurs et temps de réaction. Des anovas sur les temps de détection sur les items test "bis'' ne révèlent aucun effet significatif.
Analyse par sujets : PLAN S14<G2>*S2 G = Groupe d'induction (G1=Coda et G2=Attaque) S = Position de la cible (S1=Coda et S2=Attaque) Temps de r\'eaction S F(1,26)= 5.01 MSE=3413.45 p=0.0340 G F(1,26)= 1.34 MSE=32803.2 p=0.2576 G.S F(1,26)= 0.49 MSE=3413.45 p=0.4901 S/G1 F(1,13)= 0.83 MSE=4837.73 p=0.3789 S/G2 F(1,13)= 7.42 MSE=1989.16 p=0.0174 Erreurs S F(1,26)= 1.36 MSE=0.8407 p=0.2541 G F(1,26)= 2.38 MSE=1.0824 p=0.1350 G.S F(1,26)= 0.00 MSE=0.8407 p=0.0000 S/G1 F(1,13)= 0.45 MSE=1.2637 p=0.4859 S/G2 F(1,13)= 1.37 MSE=0.4176 p=0.2628 Analyse par items : PLAN S13<S2>*G2 Temps de r\'eaction S F(1,24)= 1.85 MSE=8588.52 p=0.1864 G F(1,24)= 11.23 MSE=3642.37 p=0.0027 G.S F(1,24)= 0.43 MSE=3642.37 p=0.4818 S/G1 F(1,24)= 0.56 MSE=6646.66 p=0.4615 S/G2 F(1,24)= 2.46 MSE=5584.23 p=0.1299 Erreurs S F(1,24)= 0.15 MSE=8.4391 p=0.2981 G F(1,24)= 6.50 MSE=0.4263 p=0.0176 G.S F(1,24)= 0.00 MSE=0.4263 p=0.0000 S/G1 F(1,24)= 0.13 MSE=4.6474 p=0.2784 S/G2 F(1,24)= 0.15 MSE=4.2179 p=0.2981
L'inspection des tables de données des deux expériences (Tab.4.3 et Tab.4.4) suggère que les Français ne se comportent pas exactement comme les Américains : seul le groupe français induit en attaque est plus rapide pour les cibles placées dans cette position. Pour comparer les deux expériences, nous avons réuni les deux ensembles de données et effectué des Anovas en déclarant un facteur supplémentaire "Langue des sujets (L)''. Celui-ci produit un effet significatif (les américains sont plus rapides que les français), mais aucune interaction. On ne peut donc pas conclure que les français et les américains ont un comportement différent. Voici ces anovas par sujets :
Analyse par sujets : PLAN S<G2*L2>*S2 G = Groupe d'induction (G1=Coda et G2=Attaque) S = Position de la cible (S1=Coda et S2=Attaque) L = Langue (am\'ericain ou fran\c cais) Temps de r\'eaction S F(1,66)= 4.87 MSE=2633.87 p=0.0308 G F(1,66)= 1.68 MSE=34253.8 p=0.1994 G.S F(1,66)= 0.11 MSE=2633.87 p=0.2588 L F(1,66)= 9.48 MSE=34253.8 p=0.0030 L.S F(1,66)= 2.22 MSE=2633.87 p=0.1410 L.G F(1,66)= 0.16 MSE=34253.8 p=0.3096 L.G.S F(1,66)= 1.71 MSE=2633.87 p=0.1955 S/G1 F(1,33)= 2.41 MSE=3499.81 p=0.1301 S/G2 F(1,33)= 4.26 MSE=1767.94 p=0.0470 Erreurs S F(1,66)= 0.88 MSE=0.5216 p=0.3516 G F(1,66)= 0.87 MSE=0.8189 p=0.3544 G.S F(1,66)= 0.49 MSE=0.5216 p=0.4864 L F(1,66)= 14.54 MSE=0.8189 p=0.0003 L.S F(1,66)= 1.31 MSE=0.5216 p=0.2565 L.G IE F(1,66)= 2.33 MSE=0.8189 p=0.1317 L.G.S IE F(1,66)= 0.33 MSE=0.5216 p=0.4324 S/G1 F(1,33)= 1.03 MSE=0.7489 p=0.3175 S/G2 F(1,33)= 0.29 MSE=0.2944 p=0.4062
Le résultat principal de cette expérience est que les sujets français ne sont pas influencés par le biais des listes, comme l'atteste l'absence d'intéraction Groupe Syllabe. Ce résultat est identique à celui des sujets américains : les Français étaient simplement un peu plus lents et commettaient plus d'erreurs, ce qui n'est pas surprenant étant donné que les phonèmes anglais ne leur étaient pas familiers.
Une conclusion possible est que les sujets français, ainsi que les américains, percevaient la cible comme appartenant au coda de la première syllabe dans tous les cas. Mais alors, le résultat de Cutler et al. (1986), où les français "syllabifiaient'' des stimuli anglais similaires aux nôtres devient difficilement compréhensible. Pourquoi, nos sujets français se fonderaient-ils sur une syllabification "acoustico-phonétique'', et ceux de Cutler et al. sur une syllabification "phonologique '' respectant les règles de syllabification spécifiques du français ?
À la recherche d'une explication, nous avons examiné les mots tests employés par Cutler et al. (1986). Il nous est apparu que presque tous étaient très similaires à des mots français. Les voici : balance, balcony, calorie, calculate, galaxie, galvanize, malady, malcontent, palace, palpitate, salad, salvage, talon, talcum. Les mots tests de l'expérience attentionnelle (cf p. ; voir également les mots inducteurs) étaient également similaires à des mots français, mais dans une moindre mesure, et après avoir fini l'expérience, les sujets affirmaient n'avoir identifié pratiquement aucun mot. Nous nous demandons si les sujets français écoutant l'anglais dans l'étude de Cutler et al. pourraient avoir utilisé des représentations syllabiques post-lexicales. L'idéal serait d'avoir les résultats d'une tâche de détection de fragment sur des pseudo-mots anglais par des sujets français.
Une autre interprétation est que les sujets utilisent des représentations différentes selon la tâche. Dans la détection de fragment, pour les Français, la syllabification serait dictée par le principe de l'attaque maximale (p.ex. "ba-lance'') ; alors que dans la détection de phonèmes attentionnelle, la syllabification serait plutôt sensible à l'acoustique-phonétique du signal (i.e. "bal-ance''). Cette idée est cependant difficile à réconcilier avec les données disponibles qui suggèrent que la détection de fragments est trés influencée par l'acoustique du signal (cf l'utilisation de la "transparence acoustique'' selon Sebastian-Gallés et al. 1992 ; ainsi que les études de "cross-splicing'' par Rietveld et Frauenfelder, citées par [FrauenfelderFrauenfelder1992]).
Finalement, il se pourrait que les sujets français n'aient pas utilisé de représentation syllabique pour effectuer la tâche de détection attentionnelle. La contradiction entre les indices acoustiques et la syllabification "théorique'' les a peut-être empêchés de se forger des attentes syllabiques.
En conclusion, le résultat obtenu en français avec le paradigme de détection attentionnelle a été répliqué en espagnol. Par contre, nous n'avons pas observé d'induction syllabique en anglais. Ce résultat peut être considéré comme une confirmation de l'hypothèse de Cutler et al. (1986) selon laquelle les locuteurs anglais n'utilisent pas la structure syllabique des stimuli. Toutefois, l'absence d'effet syllabique quand les sujets français écoutent les stimuli anglais, laisse ouverte la possibilité que la structure syllabique des stimuli ne soit pas telle qu'on le supposait. Il est clairement nécessaire de tester d'autres types de mots en anglais, particulièrement ceux où les intuitions des sujets semblent plus fermes (c'est à dire des mots avec des voyelles tendues (polar/polka), plutôt qu'avec des voyelles lâches (balance/balcony)).