Рейтинг:1

Проверка эквивалентности среди распределенных наборов

флаг kr
  • У меня есть элементы из $\{0, 1\}^{n}$ (диапазон хэш-функции)
  • Мастер $А$ может иметь любое подмножество этого диапазона.
  • Есть клиенты, каждый из которых также имеет подмножество из пространства.
  • Я хочу убедиться, что объединение наборов клиентов равно основному набору
  • Общение должно быть как можно меньше.
  • Элементы секретные. (это требование можно ослабить с помощью решения, которое потенциально может протекать)

спасибо @kelalaka за уточнение вопроса.

knaccc avatar
флаг es
Разве не тривиально отфильтровать дубликаты?
zetaprime avatar
флаг kr
Нет, это не тривиально, потому что они распределены. Фильтрация дубликатов будет означать копирование данных в несколько мест или в одно место.
zetaprime avatar
флаг kr
Давайте [продолжим это обсуждение в чате](https://chat.stackexchange.com/rooms/133625/discussion-between-zetaprime-and-kelalaka).
kelalaka avatar
флаг in
Если можно расслабить секрет, то это лучше для CS, ИМХО.
Maarten Bodewes avatar
флаг in
@knacc и все остальное Я удалил много комментариев zetaprime, поскольку они больше не имеют смысла для третьих лиц. Если чего-то не хватает, пожалуйста, добавьте их снова.
Рейтинг:1
флаг gb

Потенциальным вариантом было бы использование Фильтры Блума идентифицировать потенциал дубликаты вероятностно, а затем проверьте, действительно ли они дубликаты, отправив несколько потенциалов. Если вы используете достаточно большие фильтры Блума, этого будет достаточно для любого размера.

В качестве альтернативы, что, возможно, не очень подходит, вы можете использовать мини-эскиз.

Из ридми,

Скетчи, создаваемые этой библиотекой, можно рассматривать как «установленные контрольные суммы» с двумя особыми свойствами:

  1. Скетчи имеют предопределенную вместимость, и когда количество элементов в наборе не превышает вместимости, libminisketch всегда будет восстанавливать весь набор из скетча. Эскиз b-битных элементов разрядностью c может храниться в bc битах.
  2. Эскизы двух наборов можно объединить, добавив их (исключающее ИЛИ), чтобы получить эскиз симметричной разницы между двумя наборами (т. Е. Все элементы, которые встречаются в одном, но не в обоих входных наборах).

Поэтому, если вы используете достаточно большую емкость, вы можете просто XOR эскизов, чтобы определить уникальные элементы и удалить остальные.

kelalaka avatar
флаг in
Мы не знаем возможных размеров вселенной, подмножеств $A$ и клиентов. пока что
meshcollider avatar
флаг gb
Хм, обновлено другое потенциальное решение
kelalaka avatar
флаг in
Я думаю, минискетч не выполнит требования безопасности, и Блум тоже.
zetaprime avatar
флаг kr
для фильтров цветения: я вижу, если бы все клиенты имели фильтры цветения других, я думаю, они могли бы договориться о протоколе для удаления дубликатов. Как мне тогда проверить равенство союза?
zetaprime avatar
флаг kr
для мини-эскиза он пишет: «Эскиз b-битных элементов с емкостью c может храниться в bc битах». если я не понял это неправильно, это несколько хранит все элементы в эскизе. буду читать дальше.
meshcollider avatar
флаг gb
@zetaprime да, элементы можно восстановить из эскиза, поэтому он, вероятно, слишком велик для ваших целей. Сначала я был в основном сосредоточен на аддитивной части.
meshcollider avatar
флаг gb
С точки зрения проверки равенства это может помочь: [Вероятностный набор без ложных срабатываний?] (https://cstheory.stackexchange.com/questions/6596/a-probabilistic-set-with-no-false-positives). Я могу представить себе один сценарий, в котором после удаления всех дубликатов между клиентами вы могли бы детерминистически выполнить какой-то накопитель RSA, а затем обеспечить их равенство. По сути, хешируйте каждый элемент до простого числа (надеюсь, с незначительной вероятностью столкновения) и повышайте фиксированный генератор до всех этих простых степеней в конечном поле. Хотя это было бы вероятностно.

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.