#

cross-lingual

Here are 72 public repositories matching this topic...

FunAudioLLM / CosyVoice

Multi-lingual large voice generation model, providing inference, training and deployment full-stack ability.

python text-to-speech japanese chatbot multi-lingual tts english chinese korean cantonese natural-language-generation cross-lingual fine-grained fine-tuning voice-cloning audio-generation chatgpt gpt-4o cosyvoice

Updated Nov 11, 2024
Python

AaronZ345 / TCSinger

PyTorch Implementation of TCSinger(EMNLP 2024): Zero-Shot Singing Voice Synthesis with Style Transfer and Multi-Level Style Control

style-transfer singing zero-shot cross-lingual style-control singing-voice-synthesis speech-to-sing

Updated Nov 10, 2024
Python

chaosgen / awesome-sentence-embedding

A curated list of pretrained sentence and word embedding models

nlp awesome natural-language word-embeddings awesome-list pretrained-models unsupervised-learning embedding-models bert cross-lingual wordembedding pretrained sentence-embeddings sentence-representation language-mdoel

Updated Oct 31, 2024
Python

artitw / text2text

Text2Text Language Modeling Toolkit

search nlp information-retrieval translator tokenizer chatbot multi-lingual transformers embeddings levenshtein-distance tf-idf llama cross-lingual question-generation rag llm chatgpt

Updated Oct 29, 2024
Python

kgnlp / allophant

A multilingual phoneme recognizer capable of generalizing zero-shot to unseen phoneme inventories.

multilingual machine-learning speech-recognition neural-networks zero-shot cross-lingual phoneme-recognition

Updated Oct 24, 2024
Python

FunAudioLLM / SenseVoice

Multilingual Voice Understanding Model

multilingual python ai pytorch speech-recognition speech-to-text asr cross-lingual speech-emotion-recognition audio-event-classification aigc llm gpt-4o

Updated Oct 18, 2024
Python

iscc / iscc-sct

ISCC - Semantic Code Text

semantic-similarity cross-lingual semantic-textual-similarity cross-lingual-simialrity cross-lingual-embeddings generated-text-detection

Updated Oct 11, 2024
Python

cisnlp / MEXA

Multilingual Evaluation of English-Centric LLMs via Cross-Lingual Alignment

multilingual evaluation embeddings evaluation-metrics cross-lingual multilingual-nlp large-language-models decoder-only

Updated Oct 10, 2024
Python

shimo-lab / Universal-Geometry-with-ICA

Discovering Universal Geometry in Embeddings with ICA

embeddings pca emnlp principal-component-analysis whitening cross-lingual interpretability ica independent-component-analysis emnlp2023 isotropy

Updated Oct 10, 2024
Python

peter-yh-wu / cross-lingual

Cross-lingual Transfer for Speech Processing using Acoustic Language Similarity

multilingual cross-lingual crosslingual speech-embeddings cross-lingual-embeddings

Updated Sep 18, 2024
Python

BUAADreamer / CCRK

[KDD 2024] Improving the Consistency in Cross-Lingual Cross-Modal Retrieval with 1-to-K Contrastive Learning

retrieval wit cross-modal cross-lingual mscoco multi30k image-text-search cross-modal-retrieval xlm-roberta swin-transformer cross-lingual-retrieval image-text-retrieval vision-language-pretraining iglue xflickrco kdd2024

Updated Jul 18, 2024
Python

BobXWu / InfoCTM

Code for InfoCTM: A Mutual Information Maximization Perspective of Cross-lingual Topic Modeling (AAAI2023)

topic-modeling cross-lingual multilingual-topic-models

Updated Mar 6, 2024
Python

salesforce / FewXC

Official code and data release for Efficiently Aligned Cross-Lingual Transfer Learning for Conversational Tasks using Prompt-Tuning, accepted by findings of EACL 2024.

nlp cross-lingual task-oriented-dialogue

Updated Jan 31, 2024
Python

krystalan / ClidSum

EMNLP 2022: ClidSum: A Benchmark Dataset for Cross-Lingual Dialogue Summarization

paper dialogue dataset text-summarization cross-lingual cross-lingual-summarization dialogue-summarization

Updated Jan 13, 2024
Python

ictnlp / BayLing

“百聆”是一个基于LLaMA的语言对齐增强的英语/中文大语言模型，具有优越的英语/中文能力，在多语言和通用任务等多项测试中取得ChatGPT 90%的性能。BayLing is an English/Chinese LLM equipped with advanced language alignment, showing superior capability in English/Chinese generation, instruction following and multi-turn interaction.

translation interactive machine-translation chinese llama human-performance cross-lingual multilingual-translation general-language-model gpt4 aigc large-language-models chatgpt instruction-tuning bayling

Updated Dec 3, 2023
Python

google-research-datasets / swim-ir

SWIM-IR is a Synthetic Wikipedia-based Multilingual Information Retrieval training set with 28 million query-passage pairs spanning 33 languages, generated using PaLM 2 and summarize-then-ask prompting.

multilingual nlp machine-learning natural-language-processing information-retrieval deep-learning datasets cross-lingual training-data neural-information-retrieval

Updated Nov 13, 2023

ConsistencyVC / ConsistencyVC-voive-conversion

Using joint training speaker encoder with consistency loss to achieve cross-lingual voice conversion and expressive voice conversion

voice-conversion cross-lingual emotional-voice-conversion

Updated Oct 16, 2023
Python

harisbinzia / ZeroshotCrosslingualHateSpeech

Improving Zero-Shot Cross-Lingual Hate Speech Detection with Pseudo-Label Fine-Tuning of Transformer Language Models

cross-lingual zero-shot-learning hate-speech-detection

Updated Aug 23, 2023

andreabac3 / cross-lingual-neural-databases

Codebase of Cross-Lingual Neural Databases

information-retrieval cross-lingual informationretrieval crosslingual large-language-models

Updated Aug 10, 2023
Python

pauli31 / czech-subjectivity-dataset

This is the repository for the newly created Czech Subjectivity Dataset (Subj-CS) and our paper:

czech english transfer-learning cross-lingual subjectivity-analysis

Updated Jul 25, 2023

Improve this page

Add a description, image, and links to the cross-lingual topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the cross-lingual topic, visit your repo's landing page and select "manage topics."