" \"\"\"Return the first n items of the iterable as a list.\"\"\"\n",
" return list(islice(iterable, n))\n",
"#end def take\n",
"\n",
"# Chargement de tout les corpus\n",
"# list_corpus = {method: Corpus(method) for method in TYPE_METHOD}"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### 0.2) Deuxième partie chargement des données"
]
},
{
"cell_type": "code",
"execution_count": 20,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"..\\key_penmans.amr\n"
]
},
{
"name": "stderr",
"output_type": "stream",
"text": [
"1201 sentences read from ..\\key_penmans.amr\n"
]
}
],
"source": [
"amr_mapaie = amrdoc.AMRdoc(PATH_DATA_FILE_AMR)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# <font color=\"green\">**4 - AMR**</font>"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## **4.0) Intro et explication**"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### 4.0.1) Mémo d'utilisation"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"##### **Variable Notebook `amr_mapaie` :**\n",
"\n",
"- **`amr_mapaie`** : variable contenant le chargement du fichier AMR (classe amrdoc.AMRdoc)\n",
" - `amr_mapaie.sentences` : liste contenant toutes les phrases en AMR (classe amrdoc.AMRsentence)\n",
" - `amr_mapaie.sentences.tsv()` : liste de l'AMR au format Graph Penman (triplet)\n",
" - ATTENTION : le format Graph n'est pas unique à partir d'un AMR !!!\n",
" > *Conversion from a PENMAN string to a Tree, and vice versa, is straightforward and lossless. Conversion to a Graph, however, is potentially lossy as the same graph can be represented by different trees.*\n",
" - `amrdoc.relations_between_concepts([amr_mapaie])` : Permet d'avoir un comptage et des stats sommaires.\n",
" - Avec *, depth=1* comme argument, seulement les concepts\n",
" - Avec *, depth=2* (défaut) comme argument, les stats concepts et relation associés\n",
"\n",
"\n",
"##### **La classe `amrdoc.AMRsentence` :**\n",
"\n",
" - `amr_mapaie.sentences[0].amr` : l'AMR de la phrase (non parsé)\n",
" - `amr_mapaie.sentences[0].text` : la phrase de l'AMR\n",
" - `amr_mapaie.sentences[0].comments[0]` : le numéro du fichier (Format : 'File xxx')\n",
" - `amr_mapaie.sentences[0].tsv()` : Graph de l'AMR (même remarque)\n",
" - égale à *penman.decode(amr_mapaie.sentences[0].amr)*\n",
" - `amr_mapaie.sentences[0].getconceptlist()` : Retourne la liste des concept de la phrase\n",
"\n",
"\n",
"##### **Le module `Penman` :**\n",
"\n",
"À utiliser pour plus de précision sur le parcours des graphes/arbres de la syntaxe AMR.\n",
" - **'fair-01', 'fairness', 'fairwash-01'** pourrait nous interresser.\n",
" - *À noter que 'fairness' n'existe pas dans les concepts de probBank*\n",
"\n",
"- Une deuxième méthode serait pour chaque phrase qui ne contient pas les concepts AMR 'fair-01', 'fairness', regarder manuellement comment le mot fairness a été transcrit.\n",
"\n",
"\n",
"Ensuite, on pourrait se renseigner au sens des mots choisis dans les fichiers XML de probBank [lien](https://github.com/propbank/propbank-frames/tree/main/frames) (ou sur l'application metamorphosed)."
"""Return the first n items of the iterable as a list."""
returnlist(islice(iterable,n))
#end def take
# Chargement de tout les corpus
# list_corpus = {method: Corpus(method) for method in TYPE_METHOD}
```
%% Cell type:markdown id: tags:
### 0.2) Deuxième partie chargement des données
%% Cell type:code id: tags:
``` python
amr_mapaie=amrdoc.AMRdoc(PATH_DATA_FILE_AMR)
```
%% Output
..\key_penmans.amr
1201 sentences read from ..\key_penmans.amr
%% Cell type:markdown id: tags:
# <font color="green">**4 - AMR**</font>
%% Cell type:markdown id: tags:
## **4.0) Intro et explication**
%% Cell type:markdown id: tags:
### 4.0.1) Mémo d'utilisation
%% Cell type:markdown id: tags:
##### **Variable Notebook `amr_mapaie` :**
-**`amr_mapaie`** : variable contenant le chargement du fichier AMR (classe amrdoc.AMRdoc)
-`amr_mapaie.sentences` : liste contenant toutes les phrases en AMR (classe amrdoc.AMRsentence)
-`amr_mapaie.sentences.tsv()` : liste de l'AMR au format Graph Penman (triplet)
- ATTENTION : le format Graph n'est pas unique à partir d'un AMR !!!
> *Conversion from a PENMAN string to a Tree, and vice versa, is straightforward and lossless. Conversion to a Graph, however, is potentially lossy as the same graph can be represented by different trees.*
-`amrdoc.relations_between_concepts([amr_mapaie])` : Permet d'avoir un comptage et des stats sommaires.
- Avec *, depth=1* comme argument, seulement les concepts
- Avec *, depth=2* (défaut) comme argument, les stats concepts et relation associés
##### **La classe `amrdoc.AMRsentence` :**
-`amr_mapaie.sentences[0].amr` : l'AMR de la phrase (non parsé)
-`amr_mapaie.sentences[0].text` : la phrase de l'AMR
-`amr_mapaie.sentences[0].comments[0]` : le numéro du fichier (Format : 'File xxx')
-`amr_mapaie.sentences[0].tsv()` : Graph de l'AMR (même remarque)
- égale à *penman.decode(amr_mapaie.sentences[0].amr)*
-`amr_mapaie.sentences[0].getconceptlist()` : Retourne la liste des concept de la phrase
##### **Le module `Penman` :**
À utiliser pour plus de précision sur le parcours des graphes/arbres de la syntaxe AMR.
-**'fair-01', 'fairness', 'fairwash-01'** pourrait nous interresser.
-*À noter que 'fairness' n'existe pas dans les concepts de probBank*
- Une deuxième méthode serait pour chaque phrase qui ne contient pas les concepts AMR 'fair-01', 'fairness', regarder manuellement comment le mot fairness a été transcrit.
Ensuite, on pourrait se renseigner au sens des mots choisis dans les fichiers XML de probBank [lien](https://github.com/propbank/propbank-frames/tree/main/frames)(ou sur l'application metamorphosed).