%pip install relationalai

import relationalai as rai
from relationalai.std.graphs import Graph
from relationalai.std.aggregates import count
from relationalai.std import alias

from typing import Tuple
import pandas as pd

provider = rai.Provider()

provider.sql("""
begin
	create database if not exists RAI_DEMO;
	create schema if not exists RAI_DEMO.FRAUD_DETECTION;

	create or replace table RAI_DEMO.FRAUD_DETECTION.USER (
		ID NUMBER(38,0) NOT NULL,
		FULLNAME VARCHAR(16777216),
		PHONE_NUMBER VARCHAR(16777216),
		EMAIL VARCHAR(16777216),
		ADDRESS_ID NUMBER(38,0),
		CREDIT_CARD_NUMBER VARCHAR(16)
	);

	create or replace table RAI_DEMO.FRAUD_DETECTION.ADDRESS (
		ID NUMBER(38,0) NOT NULL,
		STREET_ADDRESS VARCHAR(16777216),
		CITY VARCHAR(16777216),
		STATE VARCHAR(16777216)
	);

	insert into RAI_DEMO.FRAUD_DETECTION.USER (ID, FULLNAME, PHONE_NUMBER, EMAIL, ADDRESS_ID, CREDIT_CARD_NUMBER)
	values
	(1,'John Doe','123-456-7890','john.doe@example.com',1,'4111111111111111'),
	(2,'Jane Smith','123-456-7891','weird.email@example.com',2,'5500000000000004'),
	(3,'Bob Brown','123-456-7893','bob.brown@example.com',3,'4111111111111112'),
	(4,'David Evans','123-456-7896','weird.email@example.com',1,'5500000000000005'),
	(5,'Eva Green','123-456-7896','eva.green@example.com',2,'340000000000010'),
	(6,'Grace White','123-456-7898','grace.white@example.com',3,'5500000000000006'),
	(7,'Hannah Lee','123-456-7899','hannah.lee@example.com',1,'340000000000011'),
	(8,'Jack Wilson','222-333-4444','jack.wilson@example.com',4,'4111111111111114'),
	(9,'Kathy Brown','333-444-5555','kathy.brown@example.com',5,'5500000000000007');

	insert into RAI_DEMO.FRAUD_DETECTION.ADDRESS (ID, STREET_ADDRESS, CITY, STATE)
	values
	(1,'123 Fake St','Springfield','IL'),
	(2,'456 Elm St','Springfield','IL'),
	(3,'123 Oak St','Springfield','IL'),
	(4,'678 Pine St','Springfield','IL'),
	(5,'890 Cedar St','Springfield','IL');
end;
""")

model = rai.Model("Fraud_Detection", ensure_change_tracking=True)

User = model.Type("User", source="rai_demo.fraud_detection.user")
Address = model.Type("Address", source="rai_demo.fraud_detection.address")

# Add a has_address property matching on the address_id in User table and the id in Address table
User.define(
    has_address = (Address, 'address_id', 'id')
)

CreditCard = model.Type("CreditCard")
Phone = model.Type("Phone")
Email = model.Type("Email")

with model.rule():
    u = User()
    u.set(has_credit_card = CreditCard.add(number = u.credit_card_number))
    u.set(has_phone = Phone.add(number = u.phone_number))
    u.set(has_email = Email.add(address = u.email))

with model.query() as select:
    u = User()
    response = select(u.fullname, u.has_address.street_address, alias(u.has_credit_card.number, 'credit_card_number'), alias(u.has_email.address, 'email_address'), alias(u.has_phone.number, 'phone_number'))

response

graph = Graph(model)
Node, Edge = graph.Node, graph.Edge

Node.extend(User, label = User.fullname, type = 'User')
Node.extend(Address, label = Address.street_address, type = 'Address')
Node.extend(CreditCard, label = CreditCard.number, type = 'CreditCard')
Node.extend(Phone, label = Phone.number, type = 'Phone')
Node.extend(Email, label = Email.address, type = 'Email')

Edge.extend(User.has_address, label = 'has address')
Edge.extend(User.has_credit_card, label = 'has credit card')
Edge.extend(User.has_phone, label = 'has phone')
Edge.extend(User.has_email, label = 'has email')

style = {
    "node": {
        "color": lambda n : 'firebrick' if n.get('focus') and n['type'] == 'User' else
            {'User': 'steelblue', 'Address': 'seagreen', 'CreditCard': 'royalblue', 'Phone': 'darkorange', 'Email': 'mediumpurple'}[n['type']],
        "hover": lambda n: n['type'],
        "size": lambda n: (50 if n.get('focus') else 30) if n['type'] == 'User' else (20 if n.get('focus') else 15),
        "shape": lambda n: 'circle' if n['type'] == 'User' else 'rectangle',
        "border_color": lambda n: 'indianred' if n.get('focus') else 'black'
    },
    "edge": {
        "color": lambda e: 'indianred' if e.get('focus') else 'grey',
        "size": lambda e: 5 if e.get('focus') else 1,
    }
}

graph.visualize(three = False, show_edge_label = True, node_label_size_factor = 1.5, style = style).display(inline = True)

with model.rule():
    u = User()
    community = graph.compute.weakly_connected_component(u)
    u.set(belongs_to = community)

with model.query() as select:
    u = User()
    response = select(u.fullname, u.belongs_to)

groups = response.results.groupby("belongs_to").fullname.apply(list)
for i, g in enumerate(groups):
    print(f"Group {i+1} with {len(g)} connected users: {g}")

Group 1 with 2 connected users: ['Bob Brown', 'Grace White']
Group 2 with 5 connected users: ['David Evans', 'Eva Green', 'Hannah Lee', 'Jane Smith', 'John Doe']
Group 3 with 1 connected users: ['Kathy Brown']
Group 4 with 1 connected users: ['Jack Wilson']

large_group_size = 4
LargeGroupUser = model.Type("LargeGroupUser")

with model.rule():
    u = User()
    count(u, per = [u.belongs_to]) >= large_group_size
    u.set(LargeGroupUser)

SuspiciousUser = model.Type("SuspiciousUser")

with model.rule():
    u = LargeGroupUser()
    u2 = LargeGroupUser(belongs_to = u.belongs_to)
    u != u2
    u.has_address != u2.has_address
    with model.case():
        u.has_email == u2.has_email
        u.set(SuspiciousUser)
    with model.case():
        u.has_phone == u2.has_phone
        u.set(SuspiciousUser)

with model.rule():
    User(has_address = SuspiciousUser().has_address).set(SuspiciousUser)

Node.extend(SuspiciousUser, focus = "suspicious")
with model.rule():
    e = Edge(from_ = SuspiciousUser())
    count(e.from_, per = [e.to]) >= 2 # Edges connecting suspicious users through same property
    e.set(focus = "suspicious")
    Node(e.to).set(focus = "suspicious")

graph.visualize(three = False, show_edge_label = True, node_label_size_factor = 1.5, style = style).display(inline = True)

@model.export("rai_demo.fraud_detection")
def suspicious_users() -> Tuple[int, str, str, str]:
    u = SuspiciousUser()
    return u.id, u.fullname, u.has_credit_card.number, u.has_address.street_address

pd.DataFrame(
    provider.sql("call rai_demo.fraud_detection.suspicious_users();"),
    columns = ["id", "fullname", "credit_card_number", "street_address"]
)

Fraud Detection

Overview

Let's get started!

Importing Packages

Importing the Data from Snowflake

Extending the Model

Getting to know the input data

Visualizing the Model Graph

Applying Graph algorithm

How many user groups were found?

Rule-based detection of uncommon patterns

Visualizing the results

Writing results back to Snowflake

fullname	street_address	credit_card_number	email_address	phone_number
Bob Brown	123 Oak St	4111111111111112	bob.brown@example.com	123-456-7893
David Evans	123 Fake St	5500000000000005	weird.email@example.com	123-456-7896
Eva Green	456 Elm St	340000000000010	eva.green@example.com	123-456-7896
Grace White	123 Oak St	5500000000000006	grace.white@example.com	123-456-7898
Hannah Lee	123 Fake St	340000000000011	hannah.lee@example.com	123-456-7899
Jack Wilson	678 Pine St	4111111111111114	jack.wilson@example.com	222-333-4444
Jane Smith	456 Elm St	5500000000000004	weird.email@example.com	123-456-7891
John Doe	123 Fake St	4111111111111111	john.doe@example.com	123-456-7890
Kathy Brown	890 Cedar St	5500000000000007	kathy.brown@example.com	333-444-5555