Рейтинг:1

l-логарифм разнообразия

флаг tl

Я хотел сделать небольшой пример для оценки анонимности с помощью l-Diversity. Для этого я использую следующую формулу для энтропии l-разнообразия ($Е$ класс эквивалентности, $S$ все возможные значения для чувствительного атрибута, $s$ конкретное значение):

$$ \operatorname{Энтропия}(E) = - \sum_{s \in S} p(E,s)\cdot \log(p(E,s)) $$

в бумага они никогда не определяли, какой логарифм используется. Это может быть база $2$, $е$ или же $10$, но я понятия не имею, что на самом деле используется. Кто-нибудь может мне помочь?

Рейтинг:1
флаг ru

Энтропия и другие меры информации могут быть определены по любому основанию, поэтому всегда должны указываться в единицах (биты/шенноны для базы 2, нац для основания e и баны/харты по основанию 10). Наиболее распространенной является база 2, но она ни в коем случае не универсальна.

Titanlord avatar
флаг tl
Проблема в том, что результатом должна быть стандартизированная оценка. Я видел, что в приложении есть одна единственная часть, используемая для доказательства, где они оценивали некоторые значения. Это приводит к натуральному логарифму, поэтому по основанию $e$.
Paul Uszak avatar
флаг cn
@Titanlord Тем не менее, в криптографии почти всегда используется основание 2. Это приводит к битам.

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.