Avatar

Xing-yu LIU 星语 刘

Interests

  • Computational Linguistics (Especially Corpus Linguistics)
  • Natural Language Processing (NLP)
  • Information Retrieval by Machine Learning&Deep Learning
  • Speech Science
  • French_English_Chinese

Education

  • PhD candidate in NLP (chatbot in medical domain), 2021-now

    Université Grenoble Alpes

  • M2 in NLP, 2019-2020

    Université Paris Nanterre

  • M1 in NLP, 2019-2020

    Université Paris 3 & Inalco

  • M2 in FLE, 2018-2019

    Sorbonne Université - Lettres

  • M1 in Phonetics & Phonology, 2017-2018

    ILPGA

Projects

*

Boîte à outils morphosyntaxique

Extraction dans les fichiers XML - Etiquettage POS tag - Extraction de patrons syntaxiques.

Classification Multi-label

Text analysis and multi-label classification on articles of 5 topics of the Reuters-21578 dataset

document structuré

XML & XSLT & XPath & XQuery exercices.

Projet - Guerre Commerciale

Mise en œuvre d’une chaîne de traitement textuel semi-automatique. Construction du corpus-analyse-présentation.

Skills

R

90%

Python

90%

Statistics

90%

Photography

40%

Experience

 
 
 
 
 

Info-linguiste

Crédit Agricole CIB

Sep 2020 – Sep 2021 Paris

Projets :

  • Data Harvesting : développer un outil cognftif pour accélérer le processus KYC (Know Your Client) et l’analyse RSE (Responsabilité sociétales des entreprises)

  • CACIB search : concevoir un moteur de recherche interne

Missions :

  • Mise en place de solutions d’analyse sémantique :

    • Analyse du besoin métier (cas d’usage)

    • Identification des approches possibles pour y répondre

    • Mise en oeuvre de l’approche la plus appropriée en fonction du contexte

  • Mise en oeuvre couvrira :

    • Identification des librairies adaptées

    • Définition d’une stratégie d’apprentissage

    • Constitution du corpus d’entrainement, avec annotation de documents si nécessaire

    • Gestion opérationnelle de l’apprentissage

    • Exécution des cycles d’apprentissage

    • Modélisation de la connaissance

 
 
 
 
 

Stagiaire en spécialisation de l’iTrameur pour le Naija

CNRS-Modyco

Mar 2020 – Jul 2020 Paris
Le stage est effectué dans le cadre du projet NaijaSynCor qui propose une étude exhaustive et approfondie la structure du naija (Nigerian Pidgin) parlé aujourd’hui au Nigéria. Ma mission consiste en spécialisation de l’iTrameur pour le corpus Naija. iTrameur permet d’explorer les données chargées via les opérations textométriques “classiques” (dictionnaire, concordancier, spécificités, segments répétés, graphique de ventilation, cooccurrents, etc.)