Download twitter stream

Document related concepts
no text concepts found
Transcript
Twitter stream and geo localization
Ofelia Cervantes
1
Twitter stream
 Tweepy
1. Modulo que permite a Python hacer una conexión con la API de
Twitter.
2. Permite extraer y enviar información de Twitter:
• Enviar tweets.
• Extraer información de usuario.
• Extraer información en tiempo real de Twitter acerca de
distintos tópicos de búsqueda.
• Etc.
3. Puede ver mas información acerca de este modulo
en:http://www.tweepy.org/
Ofelia Cervantes
Twitter stream
 Instalar Tweepy
1. Abrir una ventana de línea de comandos dependiendo de su
sistema operativo (cmd o bash).
2. Escribir y ejecutar la siguiente instrucción: pip install tweepy
Nota: debe tener instalada la versión 2.7 de Python y Pip.
Ofelia Cervantes
Twitter stream
 Verificar la instalación
1. Abrir una ventana de línea de comandos dependiendo de su
sistema operativo (cmd o bash).
2. Escribir y ejecutar la siguiente instrucción: Python
3. Dentro de la línea e comando de Python (>>) escribir lo siguiente:
Import tweepy
4. En caso de ningún error cerrar la ventana de línea de comandos, en caso
contrario tratar de volver a instalar usando pip.
Ofelia Cervantes
Twitter stream
 Ejecutar programa
1. Cambiar las siguientes variables en el programa twitterStream.py
• tweetNumber: agregar el numero de tweets que desea bajar.
• oauth tokens: agregar las llaves de acceso de a la API de Twitter:
–
–
–
–
consumer_key
consumer_secret
access_token_key
access_token_secret
• setTerms: agregar el conjunto de términos asociados a la búsqueda,
tomando en cuenta que puede ser un numero ilimitado de términos.
2. Ejecutar la aplicación de python
Ofelia Cervantes
Twitter stream
 Resultados de la ejecución
1. Un archivo llamado <fecha de creación> con los N tweets en formato
JSON
2. Un JSON por cada línea del archivo (un archivo JSON de JSONs).
3. Puede ver un ejemplo de un tweet en formato JSON en el archivo
llamado metadataTwitterExample.txt.
4. Puede ver los atributos de cada uno de los tweets en el archivo llamado
metadataTwitter.txt
Ofelia Cervantes
Twitter geo localization
 Geopy
1. Modulo que permite a Python obtener coordenadas de ciudades,
países y distintas locaciones alrededor del mundo.
2. Geopy incluye información de servicios de búsqueda como
ArcGIS, Google Geocoding API, Yahoo! PlaceFinder, etc.
3. Puede ver mas información acerca de este modulo en:
https://pypi.python.org/pypi/geopy
Ofelia Cervantes
Twitter geo localization
 Instalar Geopy
1. Abrir una ventana de línea de comandos dependiendo de su
sistema operativo (cmd o bash).
2. Escribir y ejecutar la siguiente instrucción: pip install geopy
Nota: debe tener instalada la versión 2.7 de Python y Pip.
Ofelia Cervantes
Twitter geocode
 Verificar la instalación
1. Abrir una ventana de línea de comandos dependiendo de su
sistema operativo (cmd o bash).
2. Escribir y ejecutar la siguiente instrucción: Python
3. Dentro de la línea e comando de Python (>>) escribir lo siguiente:
from geopy.geocoders import Nominatim
4. En caso de ningún error cerrar la ventana de línea de comandos, en caso
contrario tratar de volver a instalar usando pip.
Ofelia Cervantes
Twitter geo localization
 Ejecutar programa
1. Cambiar la siguientes variables en el programa geoPosition.py
• inputFileName: agregar el nombre del archivo que desea abrir (el archivo
obtenido del programa de twitterStream.py).
• outputFileName: agregar el nombre del archivo de salida, el cual
contendrá la geolocalización de la mayoría de JSONs.
2. Ejecutar la aplicación de Python.
Ofelia Cervantes
Twitter geo localization
 Resultados de la ejecución
1. Un archivo con el nombre de la variable outputFileName con los
tweets de los cuales se pudo obtener su localización (en formato
JSON).
2. Si existe la localización esta se almacenara en la propiedad
coordinates del JSON.
3. Puede ver un ejemplo de un tweet en formato JSON en el archivo
llamado metadataTwitterExample.txt.
4. Puede ver los atributos de cada uno de los tweets en el archivo llamado
metadataTwitter.txt
Ofelia Cervantes