speechlock: voice to vector, voice similarity

SpeechLock

Upload: oleg-morozenkov

Post on 12-Apr-2017

60 views

Category:

Software

1 download

Report

Download

Embed Size (px):

TRANSCRIPT

SpeechLock

Идея

Не еш меня, подумой

same person ✓

not same person ✘

Hello, I’m Tvorozhek.Let me in, please.

тыгыдык-тыгыдык гыы я лошадка

Что тут вообще происходит?

Page 3: SpeechLock: voice to vector, voice similarity

Датасет

http://forvo.comСкачано 7406 произношений.

Самые популярные слова:

1 66привет 52здравствуйте 27машина 26русский 21Китай 20медведь 19счастье 19котёнок 19

http://ru.forvo.com/languages/ru/

Page 4: SpeechLock: voice to vector, voice similarity

Первая попытка

Page 5: SpeechLock: voice to vector, voice similarity

Предобработка голосов

1. Убрали все звуки длиною меньше секунды

2. Выбрали случайную секунду

3. Нарезали на кусочки по 25 мс с пересечениями по 15 мс

4. Применили преобразование Фурье к каждому кусочку

Преобразование Фурье позволяет получить “фичи” голосов

до Фурье

после Фурье

Page 6: SpeechLock: voice to vector, voice similarity

Структура нейросети

Речь голоса 1

Речь голоса X

Conv2D MaxPool2D Dense

Concatsame weights not same w.

Out

похоже? не похоже?

batch size x sound channels x pieces x fft sound

Page 7: SpeechLock: voice to vector, voice similarity

Вторая попытка

Page 8: SpeechLock: voice to vector, voice similarity

Спектрограммы

По горизонтали время.

По вертикали частоты.

Цвет означает амплитуды, соответствующие определенной частоте. yulia_m: кусь

yulia_m: ветчина

Page 9: SpeechLock: voice to vector, voice similarity

Структура нейросети

Conv1D MaxPool1D GlobalPool Dense

Речь с голосом 1

Другая речь с голосом 1

Речь с голосом X

Речь с голосом 1, как вектор

Речь с голосом X, как вектор

Out

n filters = 100filter size = 5leaky rectify

pool size = 2 n units = 300

batch size x frequency x time

размерность векторов = 150

Другая речь с голосом 1, как

вектор

Функция потерь на следующем слайде >>>

Page 10: SpeechLock: voice to vector, voice similarity

Функция потерь

Page 11: SpeechLock: voice to vector, voice similarity

Функция предсказания

Page 12: SpeechLock: voice to vector, voice similarity

64%AUC ROC

Page 13: SpeechLock: voice to vector, voice similarity

Похожие работы

FaceNet: A Unified Embedding for Face Recognition and Clustering https://arxiv.org/pdf/1503.03832v3.pdf

Recommending music on Spotify with deep learning http://benanne.github.io/2014/08/05/spotify-cnns.html

https://arxiv.org/pdf/1503.03832v3.pdf

http://benanne.github.io/2014/08/05/spotify-cnns.html

Page 14: SpeechLock: voice to vector, voice similarity

Ссылки

github.com/xenx/speech

Презентация на гитхабе pdf

Поставь звездочку!

https://github.com/xenx/speech

Using Randomization to Attack Similarity Digests · Using Randomization to Attack Similarity Digests ... Using Randomization to Attack Similarity ... Similarity digest schemes exhibit

NRU ITMO, St Petersburg, 2018 Vector semantics -III ... · word vectors representations training algorithm, demonstrating that vectors 1) allow to estimate words similarity reasonably

User profile correlation-based similarity (UPCSim) algorithm ......collaborative ltering similarity [29], the Triangle Multiplying Jaccard (TMJ) similarity [30], and the similarity

Vector Semantics - Carnegie Mellon Universitydemo.clab.cs.cmu.edu/NLP/F19/files/slides/17-embeddings.pdf2 Word similarity for plagiarism detecton Word similarity for historical linguistcs:

Cross-lingual similarity calculation for plagiarism ... · Cross-lingual similarity calculation for plagiarism ... • Calculate similarity ... Cross-lingual similarity calculation

QUANTIFYING SPECIES SIMILARITY AND SPECIES DIVERSITY … species similarity and... · QUANTIFYING SPECIES SIMILARITY AND SPECIES ... ( Research on species similarity and species diversity

ADVANCED VOICE CHARACTERIZATION USING …data.conferenceworld.in/ICSTM2/P1646-1659.pdf1646 | P a g e ADVANCED VOICE CHARACTERIZATION USING MEL FILTERS AND LBG VECTOR QUANTIZATION Arun

freeabs all.jsp?arnumber=4563124 - Walter Scheirer · PREDICTING BIOMETRIC FACIAL RECOGNITION FAILURE WITH SIMILARITY SURFACES AND SUPPORT VECTOR MACHINES W. J. Scheirer1,2, A. Bendale1,

Term Weighting and Vector Space Modelseem5680/lecture/termw-vector-space-2014.pdf · i is the tf-idf weight of term i in the document cos( q,d ) is the cosine similarity of q and

IntelliGO: a new vector-based semantic similarity measure ... · only a few of the semantic similarity measures described so far can handle GO annotations di erently according to

Information Retrieval Basic Document Scoring. Similarity between binary vectors Document is binary vector X,Y in {0,1} v Score: overlap measure What’s

Proving triangle similarity using sas and sss similarity

Enhancing Binary Feature Vector Similarity Measures

Vector and Line Quantization for Billion-scale Similarity

Recommendation Systemscse.iitkgp.ac.in/~pawang/courses/SC15/recSys.pdf · Ratings are seen as vector in n dimensional space Similarity is calculated based on the angle between the

Algebra II, Module 2€¦ · Lesson 13: Properties of Similarity Transformations Exit Ticket A similarity transformation consists of a translation along the vector 𝐹𝐹 𝐺𝐺

Adaptive Local Dissimilarity Measures for Discriminative ...biehl/Preprints/bunte-spec-issue2010.pdf · similarity measure learned by an extension of Learning Vector Quantization

Automatic scoring of singing voice based on melodic similarity …mtg.upf.edu/system/files/publications/Emilio-Molina... · 2020-06-11 · Automatic scoring of singing voice based

Yoshinari Fujinuma, Michael Paul, and Jordan Boyd-Graber A ...users.umiacs.umd.edu/~jbg/docs/2019_acl_modularity.pdf · similarity between two words by their vector simi-larity. We

IntelliGO: a new vector-based semantic similarity measure ... · IntelliGO: a new vector-based semantic similarity measure including annotation origin Sidahmed Benabderrahmane1*,

Gray Image Colorization Using Thepade’s Transform Error Vector Rotation With Cosine, Walsh, Haar Transforms and Various Similarity Measures

CIS 530: Vector Semantics part 3€¦ · Recap: Vector Semantics Embeddings= vector models of meaning More fine-grained than just a string or index Especially good at modeling similarity/analogy

Database Management Systems, R. Ramakrishnan1 Computing Relevance, Similarity: The Vector Space Model Chapter 27, Part B Based on Larson and Hearst’s slides