Data Mining: Instagram Scraper (1)

Generationen av sociala medier har förändrats kontinuerligt. Då användte de flesta Facebook för att dela sina tankar och bilder, och Facebook var den plats som människor kommunicerar med vänner online. Men som vårt liv varar ingenting för evigt. Vid någon tidpunkt kan vi enkelt se att sociala mediers popularitet har flyttat till Instagram från Facebook. Med tiden går det inte så många som lägger upp sin idé, bilder på Facebook längre. Möjliga orsaker till denna förändring kan vara trött på den gamla plattformen, önskan om nytt innehåll eller specialfunktioner som nya sociala medier har. Olika skäl påverkar det. Kanske kan det vara lite sent att diskutera varför människor flyttade till Instagram från Facebook eftersom det har varit ett tag sedan folk har börjat använda Instagram och fortfarande flyttat till något annat, som snapchat eller vad som helst. Men jag tror personligen att det faktum att aldrig förändring är ord / bilder som användare lägger ut på sociala medier innehåller mycket information om människor, samhälle, trender och social tendens så att vi kan tolka människors avsikt via sociala medier oavsett vad sociala medier är. Således analysera sociala medier hjälper dig att förstå vad är den trend som människor följer för närvarande. Det viktigaste skälet fick mig att fokusera på Instagram är att det är specialiserat för fotot. Inte som Facebook eller Tweeter, koncentrerar Instagram sig på fotot. I huvudsak skapar det en viss typ av socialt fenomen baserat på bilder. Instagram skulle få människor att implicera sin önskan genom foton snarare än direkt avslöja den. Det är en intressant del av sociala mediefunktioner. På den tiden ville användare av sociala medier berätta vad de har, vad de tycker genom ordet och fotografierna, men för närvarande antyder de sin avsikt och vill att folk ska märka det implicit eller hemligt. Enligt dessa önskemål har bilderna på sociala medier på Instagram blivit implikationen för andra. Denna speciella önskan fick människor att flytta till Instagram. I den här punkten skulle jag vilja dela något som heter Instagram-Scraper för personer som vill studera om Instagram.

Instagram-Scraper är ett verktyg som gör att du kan få det mesta av informationen publicerad på Instagram inklusive foton, bildtexter och kommentarer.

För mer information kan du alltid kolla in den officiella webbplatsen: https://github.com/rarcega/instagram-scraper

Installationen av Instagram Scraper är ganska enkel. Om du är på Linux kan du enkelt skriva, det fungerar fortfarande i Mac OS om du redan har installerat pip.

pip install instagram-skrapa

När du har gjort installationen kan du helt enkelt skriva

instagram-skrapa -h

för att se alla funktioner som instagram-skrapa har.

användning: instagram-skrapa [-h] [- destination DESTINATION]
[--login_user LOGIN_USER] [--login_pass LOGIN_PASS]
[--login_only] [- filnamn FILENAME] [- stillhet]
[--maximum MAXIMUM] [- retain_username]
[--media_metadata] [- inkludera plats]
[--media_typer MEDIA_TYPES [MEDIA_TYPES ...]]
[- senast] [--tag] [- placering] [--sök-plats]
[--kommentarer] [--verbose VERBOSE]
[användarnamn [användarnamn ...]]
instagram-skrapa skrapar och laddar ner en instagram-användares foton och videor.
positionella argument:
användarnamn Instagram-användare som ska skrapa
valfria argument:
-h, --hjälp visa detta hjälpmeddelande och avsluta
- Destination DESTINATION, -D DESTINATION
Ladda ner destination
- login_user LOGIN_USER, -u LOGIN_USER
Instagram-inloggningsanvändare
- login_pass LOGIN_PASS, -p LOGIN_PASS
Instagram-inloggningslösenord
--login_only, -l Inaktivera anonym fallback om inloggning misslyckas
- filnamn FILENAME, -f FILENAME
Sökväg till en fil som innehåller en lista över användare att skrapa
- tyst, -q Var tyst när du skrapar
- max MAXIMUM, -m MAXIMUM
Maximalt antal objekt som ska skrapas
--retain_username, -n
Skapar underkatalog för användarnamn när destinationsflaggan är
uppsättning
--media_metadata Spara mediametadata i json-fil
- inkludera-plats Inkludera platsdata när du sparar mediametadata
--media_typer MEDIA_TYPES [MEDIA_TYPES ...], -t MEDIA_TYPES [MEDIA_TYPES ...]
Ange mediatyper som ska skrapas
- Senast skrapa nya medier sedan den senaste skrapningen
- Tagga medier med hjälp av en hashtag
- placering Skrapa media med ett plats-id
- Sök-plats Sök efter platser efter namn
- Kommentarer Spara inläggskommentarer i json-filen
--verbose VERBOSE, -v VERBOSE
Loggar verbositetsnivå
Du kan dölja dina referenser från historiken genom att läsa din
användarnamn från en lokal fil:
$ instagram-scraper @ insta_args.txt user_to_scrape
med insta_args.txt så här:
-u = my_username
-p = my_password

Denna skrapa fungerar effektivt på olika sätt. Om du letar efter en viss funktion kan du förbättra den officiella webbplatsen.

Men om du funderar på att arbeta med data mining, skulle du bättre ha ett skript för att köra det eftersom instagram-skraper ger en fråga på en gång. Även om de tillhandahåller funktionen för att få ett antal användares foton med en kommandofunktion, kanske du vill ha olika alternativ. Så vad jag föreslår för att få big data från Instagram använder Python för att skapa skriptet för att skicka flera frågor.

Här är ett enkelt exempel på skriptet för att hitta platserna har namnet "unmami burger" som drivs av Python

importera underprocessens importtid
location = 'umami burger' medan True: p = subprocess.Popen (["instagram-scraper", "- search-location", location], stdout = subprocess.PIPE) output, err = p.communicate () if output ! = "": utskriftstid. sömn (20)

Detta är ett skript för att söka på platsen lagrad i Instagram databas. Det borde motsvara sökmotorn på Instagram webbplats. Du kan alltid gärna redigera det här enkla skriptet för att få de data du vill ha. Men det du måste se till är att sova mellan varje fråga. Om du fortsätter att skicka frågor utan paus kommer Instagram att förbjuda din IP under en tid. Det finns ingen viss ledtråd för tidsgränsen för att vi kan maximera antalet frågor om inte Instagram officiellt tillhandahåller detta. Så du kanske vill testa hur mycket sömntid du ska ge. Det varierar med antalet bilder, kommentarer, antal utgångar efter sökning.

Platsmärken på Instagram-webbplats

Instagram Skrapa-utgång:

plats-id: 62304541, titel: Umami Burger, underrubrik: 432 6th Ave, stad:, lat: 40.7344, lng: -73.99861
plats-id: 292698230, titel: Umami Burger, underrubrik: 225 Liberty St, Ste 247, stad:, lat: 40.71156, lng: -74.01533
plats-id: 19002234, titel: Umami Burger, underrubrik: 338 S Anaheim Blvd, Anaheim, Kalifornien, stad: Anaheim, Kalifornien, lat: 33.8324803, lng: -117.9126456
plats-id: 11265111, titel: Umami Burger, undertexter: 2981 Bristol St, Ste B2, Costa Mesa, CA, stad: Costa Mesa, Kalifornien, lat: 33.67915, lng: -117.88604
plats-id: 87627717, titel: Umami Burger, underrubrik: 1200 Franklin St, Ste 2190, stad:, lat: 37.8025053, lng: -122.2706073

Om du syftar till att få informationen från 'Umami Burger belägen i Anaheim, Kalifornien, kan du enkelt skicka fråga med plats-id. Men för många människor har taggat den här platsen med sina bilder, jag kommer att begränsa antalet bilder jag kommer att ladda ner till 300 och också få en metadatafil. Metadatafilen kommer att bildas .json och innehåller bildtexter, antalet LIKES, de flesta data som ett foto har.

instagram-skrapa - placering 19002234 -m 300 - media_metadata

Produktion:

Tänkte till och med att jag begränsade antalet bilder men det har bara 274 bilder vilket innebär att det finns 274 bilder Instagram-användare taggade Umami Burger som ligger i Anaheim, Kalifornien på sina bilder. I din mapp kan du se ett gäng bilder och .json-filer.

Instagram-skrapa är det kraftfulla verktyget för att samla in data från Instagram. Jag delade bara hur man söker efter platstagg men du kommer att kunna få mycket mer data med den.

Hoppas att detta hjälper, och jag kommer att dela några samarbeten med Instagram Scraper och Yelp!