Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[FIX] 공백 포함하도록 설정 #1

Open
yjoonjang opened this issue Nov 29, 2024 · 0 comments
Open

[FIX] 공백 포함하도록 설정 #1

yjoonjang opened this issue Nov 29, 2024 · 0 comments

Comments

@yjoonjang
Copy link

yjoonjang commented Nov 29, 2024

안녕하세요, 최근에 한글 텍스트에서 한자를 없애주는 라이브러리를 검색하던 중, 본 레포지토리를 발견하였습니다.
먼저 정말 유용한 코드 만들어주셔서 감사합니다.

다름이 아니고, 제가 해당 코드를 작성해보며 겪었던 문제가 있어 issue를 작성하게 되었습니다.
문제는 공백이 포함되지 않는다는 문제였고, 저는 코드에 한줄만 더 작성하여 해당 문제를 해결하였습니다.
[문제]

only_hangul("구할 수 있는 토지 부분에 대한 대상(代償)으로서 선정자들에게 상환할 의무가 있다고 판단하였는바")
>>> '구할수있는토지부분에대대상으로서선정자들에게상환할의무가있다고판단하였는바'

[해결]

def only_hangul(str):
    '''한글만 추출, 띄어쓰기 포함'''
    str = unicodedata.normalize('NFC', str)
    result = ''
    for i in str:
        if i.isspace() or 'HANGUL' in unicodedata.name(i):
            result += i
    return result
only_hangul("구할 수 있는 토지 부분에 대한 대상(代償)으로서 선정자들에게 상환할 의무가 있다고 판단하였는바")
>>> '구할 수 있는 토지 부분에 대한 대상으로서 선정자들에게 상환할 의무가 있다고 판단하였는바'

이렇게 i.isspace()만 추가함으로써 해결할 수 있어서, 리포트 드립니다.

다시 한번 감사드립니다 !

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant