Ämne :Dataanalys
Ämne :Sentimentanalys av produktrecensioner
Mål :Målet med den här uppgiften är att utföra sentimentanalys på produktrecensioner för att bestämma recensentens känslor för produkten.
Instruktioner :
1. Dataförberedelse :
- Samla en datauppsättning med produktrecensioner från en lämplig källa (t.ex. Amazon, Yelp).
- Rensa data genom att ta bort dubbletter av recensioner, hantera saknade värden och konvertera texten till gemener.
2. Utforskande dataanalys :
- Utforska data för att förstå dess egenskaper och distribution.
- Utför grundläggande statistik, såsom frekvensräkningar och ordmoln, för att identifiera vanliga ord och fraser som används i recensionerna.
3. Sentimentanalys :
- Använd ett lämpligt bibliotek eller verktyg för sentimentanalys (t.ex. TextBlob, VADER eller spaCy) för att tilldela sentimentpoäng till varje recension.
- Gruppera recensionerna i positiva, negativa eller neutrala kategorier baserat på deras sentimentpoäng.
4. Funktionsteknik :
- Extrahera relevanta funktioner från recensionerna som kan bidra till känslan. Dessa kan inkludera ordfrekvenser, skiljetecken eller andra NLP-relaterade funktioner.
5. Machine Learning Model :
- Utveckla en övervakad maskininlärningsmodell för att klassificera recensionerna som positiva eller negativa.
- Träna modellen på märkta data och utvärdera dess prestanda med hjälp av lämpliga mätvärden (t.ex. noggrannhet, precision, återkallelse och F1-poäng).
6. Modelltolkning :
- Visualisera modellens förutsägelser med hjälp av förvirringsmatriser eller andra relevanta visualiseringar.
- Analysera de felklassificerade recensionerna för att identifiera förbättringsområden.
7. Rapportering :
- Skriv en rapport som sammanfattar resultaten av sentimentanalysen.
- Inkludera detaljer om dataförberedelser, utforskande dataanalys, funktionsteknik, modellträning och utvärderingsresultat.
Inlämning :
- Skicka in följande:
- En Jupyter Notebook eller Python-skript som innehåller din kod och analys.
- En PDF-rapport som sammanfattar resultaten.
Deadline :
- Uppdraget är beräknat till [datum].
- Sena inlämningar kommer att medföra en straffavgift på 10 % per dag.