Repositório com o código fonte submetido para VII Mostra de Software - UFU | TechWeek 2023.
Nesta pasta, encontra-se o código-fonte necessário para rodar a aplicação e saídas geradas.
👀 Observações:
📍 Arquivo código-fonte é “BOU-Guard-0.2.py”, esse que deve ser executado para a avaliação.
📍 Os arquivos restantes “liwc_pt.json” Dicionário utilizado - Pasta “Outputs” Está alocando as saídas geradas pela aplicação.
Nesta implementacao utilizamos o python em sua versao 3.10.4, a biblioteca python BeautifulSoup em sua versão 4.12.2 ela é utilizada para realizar a raspagem de dados (web scraping), biblioteca python NLTK na versão 3.8.1 para o processo do pré-processamento com a tokenização, utilizado o dicionario LIWC Portugues, também utilizado a Interface de Programação de Aplicação (API) GPT-3.5-Turbo para realizar a analise, identificação e listagem das expressões desejadas, por ultimo, utilizado a biblioteca Requests 2.31.0 para realizar a requisiçao nos sites obtendo o "Hypertext Transfer Protocol" (HTTP). O desenvolvimento foi realizado em uma máquina com sistema operacional de 64 bit- Windows 10 Home.
pip install beautifulsoup4==4.12.2
pip install nltk==3.8.1
Em seguida, execute um teste de aplicação para instalar o módulo utilizado.
import nltk
nltk.download('punkt')
from nltk.tokenize import word_tokenize
pip install requests==2.31.0
Como ainda estamos nos referindo a uma aplicação em andamento, algumas variáveis, como por exemplo, "link" e "prompt", estão estáticas. Portanto, para rodar a aplicação corretamente, segue o passo a passo para realizar as devidas alterações no código-fonte.
1️⃣ Adicionar sua respectiva API-KEY.
# API-KEY
token = 'XXXXXXXXXXXXXXXXXXXXXXX'
2️⃣ Referencie de forma individual os links dos sites para que sejam avaliados.
# URL DO SITE
link = "https://www.SiteParaAvaliacao.com"
3️⃣ Referencie de forma individual o prompt com base na contextualização que deseja ser avaliada no site submetido na variável "link".
prompt = [
#{'role': 'user', 'content': 'identifique e enumere as expressões associadas ao racismo'},
{'role': 'user', 'content': format}
]
4️⃣ Agora só executar a aplicação! 🏁
👀 Observação: HyperLinks referenciados leva direto para as páginas que foram avaliadas.