Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Insane output for a particular input, possibly due to the handling of the case of "ニクラベ" #27

Open
hkiyomaru opened this issue Nov 5, 2021 · 0 comments

Comments

@hkiyomaru
Copy link
Member

What

When creating an EventGraph from a sentence "web文書での精度に比べ新聞記事での精度は難易度の問題もあり一部低くなっている," the output will be insane.

echo "web文書での精度に比べ新聞記事での精度は難易度の問題もあり一部低くなっている" | jumanpp | knp | evg
{
    "sentences": [
        {
            "sid": "1",
            "ssid": 0,
            "surf": "web文書での精度に比べ新聞記事での精度は難易度の問題もあり一部低くなっている",
            "mrphs": "web 文書 で の 精度 に 比べ 新聞 記事 で の 精度 は 難易 度 の 問題 も あり 一部 低く なって いる",
            "reps": "web/web 文書/ぶんしょ で/で の/の 精度/せいど に/に 比べる/くらべる 新聞/しんぶん 記事/きじ で/で の/の 精度/せいど は/は 難易/なんい 度/ど の/の 問題/もんだい も/も 有る/ある 一部/いちぶ 低い/ひくい なる/なる いる/いる"
        }
    ],
    "events": [
        {
            "event_id": 0,
            "sid": "1",
            "ssid": 0,
            "rel": [
                {
                    "event_id": 1,
                    "label": "並列",
                    "surf": "",
                    "reliable": true,
                    "head_tid": -1
                }
            ],
            "surf": "難易度の問題もあり",
            "surf_with_mark": "難易度の問題もあり",
            "mrphs": "難易 度 の 問題 も あり",
            "mrphs_with_mark": "難易 度 の 問題 も あり",
            "normalized_mrphs": "難易 度 の 問題 も ある",
            "normalized_mrphs_with_mark": "難易 度 の 問題 も ある",
            "normalized_mrphs_without_exophora": "難易 度 の 問題 も ある",
            "normalized_mrphs_with_mark_without_exophora": "難易 度 の 問題 も ある",
            "reps": "難易/なんい 度/ど の/の 問題/もんだい も/も 有る/ある",
            "reps_with_mark": "難易/なんい 度/ど の/の 問題/もんだい も/も 有る/ある",
            "normalized_reps": "難易/なんい 度/ど の/の 問題/もんだい も/も 有る/ある",
            "normalized_reps_with_mark": "難易/なんい 度/ど の/の 問題/もんだい も/も 有る/ある",
            "content_rep_list": [
                "難易/なんい",
                "度/ど",
                "問題/もんだい",
                "有る/ある"
            ],
            "pas": {
                "predicate": {
                    "surf": "ある",
                    "normalized_surf": "ある",
                    "mrphs": "ある",
                    "normalized_mrphs": "ある",
                    "reps": "有る/ある",
                    "normalized_reps": "有る/ある",
                    "standard_reps": "有る/ある",
                    "type": "",
                    "adnominal_event_ids": [],
                    "sentential_complement_event_ids": [],
                    "children": []
                },
                "argument": {
                    "": [
                        {
                            "surf": "問題も",
                            "normalized_surf": "問題",
                            "mrphs": "問題 も",
                            "normalized_mrphs": "問題",
                            "reps": "問題/もんだい も/も",
                            "normalized_reps": "問題/もんだい",
                            "head_reps": "問題/もんだい",
                            "eid": null,
                            "flag": "N",
                            "sdist": 0,
                            "adnominal_event_ids": [],
                            "sentential_complement_event_ids": [],
                            "children": [
                                {
                                    "surf": "度の",
                                    "normalized_surf": "",
                                    "mrphs": "度 の",
                                    "normalized_mrphs": "",
                                    "reps": "度/ど の/の",
                                    "normalized_reps": "度/ど",
                                    "adnominal_event_ids": [],
                                    "sentential_complement_event_ids": [],
                                    "modifier": false,
                                    "possessive": true
                                },
                                {
                                    "surf": "難易",
                                    "normalized_surf": "難易",
                                    "mrphs": "難易",
                                    "normalized_mrphs": "難易",
                                    "reps": "難易/なんい",
                                    "normalized_reps": "難易/なんい",
                                    "adnominal_event_ids": [],
                                    "sentential_complement_event_ids": [],
                                    "modifier": false,
                                    "possessive": false
                                }
                            ]
                        }
                    ]
                }
            },
            "features": {
                "modality": [],
                "tense": "unknown",
                "negation": false,
                "state": "状態述語",
                "complement": false
            }
        },
        {
            "event_id": 1,
            "sid": "1",
            "ssid": 0,
            "rel": [],
            "surf": "比べ新聞記事での精度は一部低くなっている",
            "surf_with_mark": "比べ新聞記事での精度は | 一部低くなっている",
            "mrphs": "比べ 新聞 記事 で の 精度 は 一部 低く なって いる",
            "mrphs_with_mark": "比べ 新聞 記事 で の 精度 は | 一部 低く なって いる",
            "normalized_mrphs": "比べ 新聞 記事 で の 精度 は 一部 低く なって いる",
            "normalized_mrphs_with_mark": "比べ 新聞 記事 で の 精度 は | 一部 低く なって いる",
            "normalized_mrphs_without_exophora": "比べ 新聞 記事 で の 精度 は 一部 低く なって いる",
            "normalized_mrphs_with_mark_without_exophora": "比べ 新聞 記事 で の 精度 は | 一部 低く なって いる",
            "reps": "比べる/くらべる 新聞/しんぶん 記事/きじ で/で の/の 精度/せいど は/は 一部/いちぶ 低い/ひくい なる/なる いる/いる",
            "reps_with_mark": "比べる/くらべる 新聞/しんぶん 記事/きじ で/で の/の 精度/せいど は/は | 一部/いちぶ 低い/ひくい なる/なる いる/いる",
            "normalized_reps": "比べる/くらべる 新聞/しんぶん 記事/きじ で/で の/の 精度/せいど は/は 一部/いちぶ 低い/ひくい なる/なる いる/いる",
            "normalized_reps_with_mark": "比べる/くらべる 新聞/しんぶん 記事/きじ で/で の/の 精度/せいど は/は | 一部/いちぶ 低い/ひくい なる/なる いる/いる",
            "content_rep_list": [
                "比べる/くらべる",
                "新聞/しんぶん",
                "記事/きじ",
                "精度/せいど",
                "一部/いちぶ",
                "低い/ひくい"
            ],
            "pas": {
                "predicate": {
                    "surf": "低くなっている",
                    "normalized_surf": "低くなっている",
                    "mrphs": "低く なって いる",
                    "normalized_mrphs": "低く なって いる",
                    "reps": "低い/ひくい+なる/なる~テ形+いる/いる",
                    "normalized_reps": "低い/ひくい+なる/なる~テ形+いる/いる",
                    "standard_reps": "低い/ひくい+なる/なる~テ形+いる/いる",
                    "type": "",
                    "adnominal_event_ids": [],
                    "sentential_complement_event_ids": [],
                    "children": []
                },
                "argument": {
                    "ガ2": [
                        {
                            "surf": "一部",
                            "normalized_surf": "一部",
                            "mrphs": "一部",
                            "normalized_mrphs": "一部",
                            "reps": "一部/いちぶ",
                            "normalized_reps": "一部/いちぶ",
                            "head_reps": "一部/いちぶ",
                            "eid": null,
                            "flag": "N",
                            "sdist": 0,
                            "adnominal_event_ids": [],
                            "sentential_complement_event_ids": [],
                            "children": []
                        }
                    ],
                    "": [
                        {
                            "surf": "精度は",
                            "normalized_surf": "精度",
                            "mrphs": "精度 は",
                            "normalized_mrphs": "精度",
                            "reps": "精度/せいど は/は",
                            "normalized_reps": "精度/せいど",
                            "head_reps": "精度/せいど",
                            "eid": null,
                            "flag": "N",
                            "sdist": 0,
                            "adnominal_event_ids": [],
                            "sentential_complement_event_ids": [],
                            "children": [
                                {
                                    "surf": "記事での",
                                    "normalized_surf": "記事",
                                    "mrphs": "記事 で の",
                                    "normalized_mrphs": "記事",
                                    "reps": "記事/きじ で/で の/の",
                                    "normalized_reps": "記事/きじ",
                                    "adnominal_event_ids": [],
                                    "sentential_complement_event_ids": [],
                                    "modifier": false,
                                    "possessive": false
                                },
                                {
                                    "surf": "新聞",
                                    "normalized_surf": "新聞",
                                    "mrphs": "新聞",
                                    "normalized_mrphs": "新聞",
                                    "reps": "新聞/しんぶん",
                                    "normalized_reps": "新聞/しんぶん",
                                    "adnominal_event_ids": [],
                                    "sentential_complement_event_ids": [],
                                    "modifier": false,
                                    "possessive": false
                                }
                            ]
                        }
                    ],
                    "ニクラベル": [
                        {
                            "surf": "精度に比べ",
                            "normalized_surf": "精度",
                            "mrphs": "精度 に 比べ",
                            "normalized_mrphs": "精度",
                            "reps": "精度/せいど に/に 比べる/くらべる",
                            "normalized_reps": "精度/せいど",
                            "head_reps": "精度/せいど",
                            "eid": null,
                            "flag": "C",
                            "sdist": 0,
                            "adnominal_event_ids": [],
                            "sentential_complement_event_ids": [],
                            "children": [
                                {
                                    "surf": "文書での",
                                    "normalized_surf": "文書",
                                    "mrphs": "文書 で の",
                                    "normalized_mrphs": "文書",
                                    "reps": "文書/ぶんしょ で/で の/の",
                                    "normalized_reps": "文書/ぶんしょ",
                                    "adnominal_event_ids": [],
                                    "sentential_complement_event_ids": [],
                                    "modifier": false,
                                    "possessive": false
                                },
                                {
                                    "surf": "web",
                                    "normalized_surf": "web",
                                    "mrphs": "web",
                                    "normalized_mrphs": "web",
                                    "reps": "web/web",
                                    "normalized_reps": "web/web",
                                    "adnominal_event_ids": [],
                                    "sentential_complement_event_ids": [],
                                    "modifier": false,
                                    "possessive": false
                                }
                            ]
                        }
                    ]
                }
            },
            "features": {
                "modality": [],
                "tense": "非過去",
                "negation": false,
                "state": "動態述語",
                "complement": false
            }
        }
    ]
}
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant