문단 나누기
- 인쇄
- PDF
문단 나누기
- 인쇄
- PDF
기사 요약
이 요약이 도움이 되었나요?
의견을 보내 주셔서 감사합니다.
Classic/VPC 환경에서 이용 가능합니다.
문장 간 유사도를 파악하여 주제 단위로 글의 단락을 구분합니다.
요청
요청 형식을 설명합니다. 요청 형식은 다음과 같습니다.
메서드 | URI |
---|---|
POST | /testapp/v1/api-tools/segmentation/{appId} |
요청 헤더
헤더에 대한 설명은 다음과 같습니다.
헤더 | 필수 여부 | 설명 |
---|---|---|
X-NCP-CLOVASTUDIO-API-KEY | Y | 테스트 앱 생성 시 발급 받은 API KEY |
X-NCP-CLOVASTUDIO-REQUEST-ID | N | 각 요청에 대한 요청 아이디 |
Content-Type | Y | application/json |
요청 경로 파라미터
파라미터에 대한 설명은 다음과 같습니다.
필드 | 타입 | 필수 여부 | 설명 |
---|---|---|---|
appId | string | Y | 해당 테스트 앱/서비스 앱의 고유 ID |
요청 바디
바디에 대한 설명은 다음과 같습니다.
필드 | 타입 | 필수 여부 | 설명 |
---|---|---|---|
texts | array[string] | Y | 문단 나누기를 수행할 문서 |
alpha | float | N | 문단 나누기를 위한 thresholds 값. 클수록 나눠지는 문단 수 증가 |
alpha | float | N | 문단 나누기를 위한 thresholds 값. 클수록 나눠지는 문단 수 증가 |
segCnt | integer | N | 원하는 문단 나누기 수 |
postProcess | boolean | N | 문단 나누기 수행 후 원하는 길이로 문단을 합치거나 나누는 후처리 수행 여부 |
postProcessMaxSize | integer | N | post process module 적용 시 문단에 포함되는 문자열의 최대 글자 수 |
postProcessMinSize | integer | N | post process module 적용 시 문단에 포함되는 문자열의 최소 글자 수 |
요청 구문
구문 예시는 다음과 같습니다.
curl --location 'https://clovastudio.stream.gov-ntruss.com/testapp/v1/api-tools/segmentation/{appId}' \
--header 'X-NCP-CLOVASTUDIO-API-KEY: <X-NCP-CLOVASTUDIO-API-KEY>' \
--header 'X-NCP-CLOVASTUDIO-REQUEST-ID: <X-NCP-CLOVASTUDIO-REQUEST-ID>' \
--header 'Content-Type: application/json' \
--data '{
"text": "노트는 어떻게 생성할 수 있나요?\n두 가지 방법이 있습니다.\n클로바노트 앱에서 추가 버튼을 눌러 녹음을 시작하거나, 스마트폰에 저장해둔 녹음 파일을 불러오면 노트가 생성된답니다.\n이렇게 만들어진 노트는 앱뿐만 아니라 PC의 클로바노트 웹사이트에서도 연동되어 확인하실 수 있는데요.\n클로바노트 사이트에서는 저장된 녹음파일을 불러오면 노트를 만들 수 있답니다.\n북마크는 어떻게 사용하는 건가요?\n클로바노트 앱 화면에서 녹음 중간에 북마크 버튼을 누르면, 아래처럼 표시되어 녹음을 마치고 나서도 필요한 구간을 쉽게 찾을 수 있죠.\n평소 녹음을 마치고 나면 분명히 다시 찾아보고 싶은 녹음 구간이 있었을 거예요.\n그런 순간을 위해 북마크를 제공하고 있답니다.\n그럼 녹음한 음성은 어떻게 들어볼 수 있나요?\n생성된 노트에서 기록된 대화를 선택하면 녹음 음성을 다시 들어볼 수 있답니다.\n만약 음성 기록이 잘못된 구간이 있다면 다시 한 번 음성을 들어보고 편집 버튼을 눌러 쉽게 바로잡을 수 있죠.",
"alpha": -100,
"segCnt": -1,
"postProcess": false,
"postProcessMaxSize": 2000,
"postProcessMinSize": 500
}'
응답
응답 형식을 설명합니다.
응답 바디
바디에 대한 설명은 다음과 같습니다.
필드 | 타입 | 필수 여부 | 설명 |
---|---|---|---|
topicSeg | array[array[string]] | Y | 세부 주제별 문단이 구분된 결과 |
span | array[array[integer]] | N | 문단이 나눠진 텍스트의 인덱스(문단이 나눠진 위치 확인) |
inputTokens | integer | Y | 문단 나누기를 수행한 문서의 토큰 수 |
응답 구문
구문 예시는 다음과 같습니다.
성공
호출이 성공한 경우의 구문 예시는 다음과 같습니다.
{
"status": {
"code": "20000",
"message": "OK"
},
"result": {
"topicSeg": [
[
"노트는 어떻게 생성할 수 있나요?",
"두 가지 방법이 있습니다."
],
[
"클로바노트 앱에서 추가 버튼을 눌러 녹음을 시작하거나, 스마트폰에 저장해둔 녹음 파일을 불러오면 노트가 생성된답니다.",
"이렇게 만들어진 노트는 앱뿐만 아니라 PC의 클로바노트 웹사이트에서도 연동되어 확인하실 수 있는데요.",
"클로바노트 사이트에서는 저장된 녹음파일을 불러오면 노트를 만들 수 있답니다."
],
[
"북마크는 어떻게 사용하는 건가요?",
"클로바노트 앱 화면에서 녹음 중간에 북마크 버튼을 누르면, 아래처럼 표시되어 녹음을 마치고 나서도 필요한 구간을 쉽게 찾을 수 있죠.",
"평소 녹음을 마치고 나면 분명히 다시 찾아보고 싶은 녹음 구간이 있었을 거예요.",
"그런 순간을 위해 북마크를 제공하고 있답니다."
],
[
"그럼 녹음한 음성은 어떻게 들어볼 수 있나요?",
"생성된 노트에서 기록된 대화를 선택하면 녹음 음성을 다시 들어볼 수 있답니다.",
"만약 음성 기록이 잘못된 구간이 있다면 다시 한 번 음성을 들어보고 편집 버튼을 눌러 쉽게 바로잡을 수 있죠."
]
],
"span": [
[
0,
1
],
[
2,
3,
4
],
[
5,
6,
7,
8
],
[
9,
10,
11
]
],
"inputTokens": 330
}
}
실패
호출이 실패한 경우의 구문 예시는 다음과 같습니다.
이 문서가 도움이 되었습니까?