DocumentAggregation

문서를 기반으로 다양한 조건으로 집계하여 처리한다.

Function specification

DocumentAggregation(category, section, query, groupby, 
date_from=None, date_to=None, min_count=0)

Parameters

Parameter

Type

Description

category

string or list of string

국내뉴스:news

증권사 보고서: research

공시,IR : company

특허 : patent

section

string or list of string

Category가 news일 경우

정치: politics

경제: economy

사회: society

문화: culture

세계: world

기술/IT: tech

연예: entertainment

사설: opinion

Category가 research일 경우

시장 전망: market

투자전략: strategy

기업 보고서: company

산업 보고서: industry

경제 보고서: economy

채권 보고서: bond

Category 가 company 인 경우

IR : ir

공시 : disclosure

Category 가 patent 인 경우

특허 : patent

query

string

검색 쿼리

groupby

string

어떤 조건으로 집계할 것인지 여부. 개별 문서의 결과 항목들을 기준으로 집계가 가능하다. 예를 들어, named_entities.entities.company.symbol:100 로 지정하면, 문서를 named_entities 의 심볼을 기준으로 최대 100개까지 집계한다는 의미이다.

date_from

string

검색 시작 시점 (YYYYMMDD)

date_to

string

검색 종료 시점(YYYYMMDD)

min_count

int

최소 결과 개수 ( 기본값 : 0 )

Result Layout

Result:DataFrame

활용 예시

DocumentAggregation 을 이용한 특정 주제와 관련된 기업 리스트 추출

  • DocumentAggregation("news", None, "키워드", "named_entities.entities.company.name:100", date_from=2020-01-01)

DocumentAggregation 을 이용한 ESG 이슈가 발생한 기업 리스트 추출

  • DocumentAggregation("news", "economy", "ESG검색조건", "securities.name:100", date_from=2020-01-01)

DocumentAggregation 을 이용한 특정 주제에 대한 워드 클라우드 표시

  • DocumentAggregation("topic-news",%20None,%20"키워드",groupby="keywords.keyword:100",%20date_from=2010-01-01)

Last updated

Was this helpful?