У меня есть файл журнала, как показано ниже:
02-12-2022 15:18:22 +0330 SOCK5.6699 00000 user144 97.251.107.125:38605 1.1.1.1:443 51766 169369 0 ПОДКЛЮЧИТЬ 1.1.1.1:443
02-12-2022 15:18:27 +0330 SOCK5.6699 00094 user156 32.99.193.2:51242 1.1.1.1:443 715 388 0 ПОДКЛЮЧИТЬ 1.1.1.1:443
02-12-2022 15:18:56 +0330 SOCK5.6699 00000 user105 191.184.66.98:40048 1.1.1.1:443 18105 29029 0 ПОДКЛЮЧИТЬ 1.1.1.1:443
02-12-2022 15:18:56 +0330 SOCK5.6699 00000 user105 191.184.66.98:40070 1.1.1.1:443 674 26805 0 ПОДКЛЮЧИТЬ 1.1.1.1:443
02-12-2022 15:20:24 +0330 SOCK5.6699 00000 user143 112.199.63.119:60682 1.1.1.1:443 475 445 0 ПОДКЛЮЧИТЬ 1.1.1.1:443
02-12-2022 15:20:37 +0330 SOCK5.6699 00000 user105 191.184.66.98:40102 1.1.1.1:443 12913 18780 0 ПОДКЛЮЧИТЬ 1.1.1.1:443
02-12-2022 15:20:42 +0330 SOCK5.6699 00000 user143 112.199.63.119:60688 1.1.1.1:443 4530 34717 0 ПОДКЛЮЧИТЬ 1.1.1.1:443
12-02-2022 15:20:44 +0330 SOCK5.6699 00000 user127 212.167.145.49:2972 1.1.1.1:443 827 267 0 ПОДКЛЮЧИТЬ 1.1.1.1:443
моя цель - извлечь две части этого файла журнала:
- Имя пользователя
- IP-адрес источника пользователя
ниже приведен образец необходимых данных.
02-12-2022 15:18:22 +0330 SOCK5.6699 00000 пользователь 144 97.251.107.125:38605 1.1.1.1:443 51766 169369 0 ПОДКЛЮЧИТЬ 1.1.1.1:443
Поэтому я написал скрипт Python для извлечения обоих элементов и сохранения их в отдельных списках, а затем соединил их с помощью функции zip.
импорт pprint
импорт коллекций
IP-список=[]
для l в данных:
ip_port=l[53:71]
iplist.append(ip_port.split(':')[0])
список пользователей=[]
для вас в данных:
пользователь=у[42:52]
userlist.append(user.replace(" ", ""))
a = список (zip (iplist, список пользователей))
most_ip=коллекции.Счетчик(a).most_common(5)
pprint.pprint(самый_ip)
Этот код отлично работает, и я могу получить наиболее часто используемый IP-адрес с соответствующим именем пользователя.
Также нужно упомянуть, что я не использовал ре модуль, поскольку он указывал второй IP-адрес (целевой IP-адрес 1.1.1.1, который меня не волнует)
Вопрос:
Есть ли другой способ (более аккуратный), чем тот, которым я написал код?