Skip to content

IPA 발음 기호, Levenshtein Distance 기반 발음 평가 지표 개발

License

Notifications You must be signed in to change notification settings

DevTae/PronunciationEvaluator

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

35 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

PronunciationEvaluator

What is this?

  • IPA 문자열에 대한 발음 속성을 바탕으로 유사도를 반환하는 함수이다.
  • 따라서, 발음이 얼마나 유사한지 판단할 수 있는 척도인 Pronunciation Error Rate (PER) 를 제안하고자 한다.
    • 다음 함수에서의 결과값은 1 - Pronunciation Error Rate (PER)와 같으니, 용도에 맞게 수정하여 사용하면 된다.
  • 현재, 문자열을 비교하는 평가 지표는 CER, WER 등 다양하다.
  • 해당 평가 지표들은 각각의 Character 또는 Word 단위에서 한 글자만 틀리게 되어도 아예 다른 문자로 인식한다.
  • 이러한 상황에서 세부적인 발음에 대한 유사도가 필요하여 주어진 문자에 대하여 다양한 속성으로 벡터화하여 유사도를 계산하도록 하였다.
    • ex) 조음 위치, 조음 방법, 조음 강도, 유성음 여부, 입술 모양

Pronunciation Analysis

  • 발음 단위로 자음에 대하여 4 개의 속성, 모음에 대하여 3 개의 속성 으로 벡터화 진행
    • 자음 의 속성

      • 자음 조음위치, 자음 조음방법, 자음 조음강도, 자음 유성음여부 가 있다.
    • 모음 의 속성

      • 모음 조음상하위치, 모음 조음좌우위치, 모음 입술모양 이 있다.
    • 다음 그래프와 같이 표현할 수 있음.

      values, types, origs = mapping_ipa_with_value("ɑnnjʌŋɑsɛjo")
      vector_values, vector_types, vector_origs = vectorize_ipa(values, types, origs)
      plt.plot(vector_values)

      1

      • 위 사진의 경우, 자음 + 모음 + 받침자음 을 합쳐 하나의 벡터 형식으로 표현한 형식이다.
      • 현재, STT 모델 등에 적용할 때 반환하는 결과가 위의 구조를 벗어날 수 있기 때문에 자음과 모음에 대한 각각의 벡터값을 합치지 않고 그대로 비교 연산을 진행하도록 하였다.

How to Calculate?

  • 각 벡터에 대한 수치를 활용하여 가장 유사한 부분집합을 바탕으로 채점 진행

    • 동적계획법 (Dynamic Programming) 활용
    • Levenshtein Distance 에서의 Substitution CostIPA Similarity 로서 접근하여 계산
    { 'answer_ipa': '정답 IPA', 'user_ipa': '유저 IPA', 'score': "전체 점수",
        'summary': "각 매핑된 부분에 대한 피드백 제공" }

    3

  • 채점 기준

    • Levenshtein Distance 에 의한 Insertion Cost, Deletion Cost, Substitution Cost 를 구함
      • 자음 조음위치자음 조음방법 이 다르면 Deletion 처리
      • 자음 조음강도자음 유성음여부 에 따라 Substitution Cost 계산
      • 모음 입술모양, 모음 조음상하위치, 모음 조음상하위치 에 따라 Substitution Cost 계산
  • PronunciationEvaluator 적용 예시

    • 다음과 같이 적용할 수 있음.

    4

Reference

About

IPA 발음 기호, Levenshtein Distance 기반 발음 평가 지표 개발

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published